WEKO3
アイテム
敵対的生成ネットワークを用いた画像生成と音声変換
https://ipsj.ixsq.nii.ac.jp/records/211578
https://ipsj.ixsq.nii.ac.jp/records/211578d9818c1e-5717-43c6-9858-39c3e19dd4ff
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2021-06-11 | |||||||
タイトル | ||||||||
タイトル | 敵対的生成ネットワークを用いた画像生成と音声変換 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 招待講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話株式会社 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT | ||||||||
著者名 |
金子, 卓弘
× 金子, 卓弘
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 画像や音声は,私たち人間がコミュニケーションを行う上で重要かつ不可欠なものであるが,必ずしも理想的なものが得られるとは限らない.この理想とのギャップを解消する手段として,近年,深層学習に基づく生成モデル(深層生成モデル)を用いた自動生成・変換が注目を集めている.特に,近年最も脚光を浴びている深層生成モデルの一つとして,敵対的生成ネットワーク(GAN: Generative Adversarial Networks)がある.GAN は生成器と識別器の二つのニューラルネットワークから構成されており,これら二つのネットワークを互いに競合する条件下で学習させることによって,実際のデータと見分けがつかないようなデータを生成可能な生成器の学習を可能にしている.このような学習機構を用いることで,GAN では,学習対象のデータ分布を陽に仮定することなく学習することができ,この柔軟性によって様々なタスクで解決の糸口を与えてきている.本講演では,まず,GAN の黎明期から主要な研究対象である「画像生成」を題材に,GAN の近年の発展および拡張について,講演者らの取り組みを紹介しながら解説する.また,深層学習に基づくモデルの強みの一つは,表現学習をも内包することによって,分野をまたいだ技術応用が容易になった点である.GAN に関しても同様のことが成り立っており,画像分野における知見を活かした他分野への技術応用が盛んに行われている.その一例として,本講演では,GAN の「音声変換」への応用について,講演者らの研究事例に触れながら説明する.最後に,GAN の音学分野での応用可能性などについて議論しながら,GAN 研究の今後を展望する. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2021-SLP-137, 号 3, p. 1-1, 発行日 2021-06-11 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8663 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |