WEKO3
アイテム
オノマトペ音声を用いた効果音合成技術におけるニューラルボコーダの検討
https://ipsj.ixsq.nii.ac.jp/records/226411
https://ipsj.ixsq.nii.ac.jp/records/226411efc791c4-3a17-4da6-a690-ef604a324635
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-06-16 | |||||||||
| タイトル | ||||||||||
| タイトル | オノマトペ音声を用いた効果音合成技術におけるニューラルボコーダの検討 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 一般発表 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 京都産業大学大学院先端情報学研究科 | ||||||||||
| 著者所属 | ||||||||||
| 京都産業大学情報理工学部 | ||||||||||
| 著者名 |
滝沢, 力
× 滝沢, 力
× 平井, 重行
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | メディア作品などの音響制作では,様々な知識や経験,スキルが要求される.望んだ音をイメージし,音韻や韻律などのニュアンスを含んだ擬音語を発話することは比較的容易であり,それらを入力として効果音に変換する生成モデルを本研究では提案している.そこでは,具体的な効果音として,様々なニュアンス表現が考えられる爆発音に焦点を当て,データセットの作成および学習,合成を試みた.その学習済モデルで,ある程度のニュアンスを考慮した合成が可能であるものの,合成音の品質向上に向けて取り組むべき課題がある.その課題のうち,今回はニューラルボコーダに注目し,iSTFTNet を用いた波形合成を試みた.本稿では,これまで利用してきた CBHG・Griffin-Lim アルゴリズムと,iSTFTNet のそれぞれで効果音を合成した結果から,その音質や波形の特徴について比較検討した内容を報告する. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10442647 | |||||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2023-SLP-147, 号 40, p. 1-6, 発行日 2023-06-16 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8663 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||