WEKO3
アイテム
空間周波数損失を用いた畳み込みニューラルネットワークの学習
https://ipsj.ixsq.nii.ac.jp/records/209807
https://ipsj.ixsq.nii.ac.jp/records/209807b0471ae8-acc0-46f3-be48-3a4c465074ed
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
| CVIM:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-02-25 | |||||||
| タイトル | ||||||||
| タイトル | 空間周波数損失を用いた畳み込みニューラルネットワークの学習 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Learning Convolutional Neural Networks with Spatial Frequency Loss | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | セッション1-2 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 産業技術総合研究所人間情報インタラクション研究部門 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Human Informatics and Interaction Research Institute, National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
| 著者名 |
市村, 直幸
× 市村, 直幸
|
|||||||
| 著者名(英) |
Naoyuki, Ichimura
× Naoyuki, Ichimura
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 画像生成を行う畳み込みニューラルネットワーク (CNNs) の学習では,画像間の一致度を測るために,画素値毎の差異を計算する L2 損失および L1 損失(pixel-wise L2 loss and pixel-wise L1 loss)が用いられている.しかし,これらの損失を用いると,ボケた画像が生成されるという問題がある.本論文では,この問題を解決するために,空間周波数損失 (Spatial Frequency Loss:SFL) を用いた CNNs の学習方法を提案する.生成された画像のボケは高い空間周波数成分が失われていることを表し,その欠落の度合いは CNNs の周波数応答に依存する.CNNs の周波数応答を解析するために,バンドパス特性をもつラプラシアンフィルタバンクを CNNs に付加し,画像のサブバンドに属する特徴を抽出する.そして,全てのサブバンドにわたる特徴の L2 損失の総和として SFL を定義し,学習においては高周波成分に対応する損失を重み付けて強調する.CNNs を用いた image inpainting の実験により,SFL を用いた学習は,ボケが少なく,かつ,詳細なテクスチャをもつ画像の生成に有効であることを示した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | The pixel-wise L2 and pixel-wise L1 losses have been commonly used to measure the consistency between images in learning convolutional neural networks (CNNs) for image generation tasks. However, using the losses poses the well-known problem of producing blurry images. This paper presents a learning method using a novel loss called the spatial frequency loss (SFL) to mitigate the problem. The blurs in generated images show the lack of high spatial frequency components and the degree of deficiency depends on the frequency response of CNNs. In order to analyze the frequency response of CNNs, a Laplacian filter bank that has a band-pass property is added to CNNs to extract features in subbands of images. Then the SFL is defined by the sum of the L2 losses of the features over subbands and the losses corresponding to high spatial frequency components are emphasized by weighting in learning. Experimental results for image inpainting using CNNs demonstrate that learning with the SFL is fairly useful to reduce the blurs and produce the fine texture details in generated images. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11131797 | |||||||
| 書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2021-CVIM-225, 号 9, p. 1-6, 発行日 2021-02-25 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8701 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||