ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2021
  4. 2021-CVIM-225

空間周波数損失を用いた畳み込みニューラルネットワークの学習

https://ipsj.ixsq.nii.ac.jp/records/209807
https://ipsj.ixsq.nii.ac.jp/records/209807
b0471ae8-acc0-46f3-be48-3a4c465074ed
名前 / ファイル ライセンス アクション
IPSJ-CVIM21225009.pdf IPSJ-CVIM21225009.pdf (4.0 MB)
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
CVIM:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2021-02-25
タイトル
タイトル 空間周波数損失を用いた畳み込みニューラルネットワークの学習
タイトル
言語 en
タイトル Learning Convolutional Neural Networks with Spatial Frequency Loss
言語
言語 jpn
キーワード
主題Scheme Other
主題 セッション1-2
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
産業技術総合研究所人間情報インタラクション研究部門
著者所属(英)
en
Human Informatics and Interaction Research Institute, National Institute of Advanced Industrial Science and Technology (AIST)
著者名 市村, 直幸

× 市村, 直幸

市村, 直幸

Search repository
著者名(英) Naoyuki, Ichimura

× Naoyuki, Ichimura

en Naoyuki, Ichimura

Search repository
論文抄録
内容記述タイプ Other
内容記述 画像生成を行う畳み込みニューラルネットワーク (CNNs) の学習では,画像間の一致度を測るために,画素値毎の差異を計算する L2 損失および L1 損失(pixel-wise L2 loss and pixel-wise L1 loss)が用いられている.しかし,これらの損失を用いると,ボケた画像が生成されるという問題がある.本論文では,この問題を解決するために,空間周波数損失 (Spatial Frequency Loss:SFL) を用いた CNNs の学習方法を提案する.生成された画像のボケは高い空間周波数成分が失われていることを表し,その欠落の度合いは CNNs の周波数応答に依存する.CNNs の周波数応答を解析するために,バンドパス特性をもつラプラシアンフィルタバンクを CNNs に付加し,画像のサブバンドに属する特徴を抽出する.そして,全てのサブバンドにわたる特徴の L2 損失の総和として SFL を定義し,学習においては高周波成分に対応する損失を重み付けて強調する.CNNs を用いた image inpainting の実験により,SFL を用いた学習は,ボケが少なく,かつ,詳細なテクスチャをもつ画像の生成に有効であることを示した.
論文抄録(英)
内容記述タイプ Other
内容記述 The pixel-wise L2 and pixel-wise L1 losses have been commonly used to measure the consistency between images in learning convolutional neural networks (CNNs) for image generation tasks. However, using the losses poses the well-known problem of producing blurry images. This paper presents a learning method using a novel loss called the spatial frequency loss (SFL) to mitigate the problem. The blurs in generated images show the lack of high spatial frequency components and the degree of deficiency depends on the frequency response of CNNs. In order to analyze the frequency response of CNNs, a Laplacian filter bank that has a band-pass property is added to CNNs to extract features in subbands of images. Then the SFL is defined by the sum of the L2 losses of the features over subbands and the losses corresponding to high spatial frequency components are emphasized by weighting in learning. Experimental results for image inpainting using CNNs demonstrate that learning with the SFL is fairly useful to reduce the blurs and produce the fine texture details in generated images.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2021-CVIM-225, 号 9, p. 1-6, 発行日 2021-02-25
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 18:23:01.325730
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3