WEKO3
アイテム
言語非依存な口真似による効果音合成手法PronounSEの評価
https://ipsj.ixsq.nii.ac.jp/records/2002347
https://ipsj.ixsq.nii.ac.jp/records/200234736c0e1b6-c895-49ea-8066-8963cd5b48bc
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2027年6月6日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-06-06 | |||||||||||||
| タイトル | ||||||||||||||
| 言語 | ja | |||||||||||||
| タイトル | 言語非依存な口真似による効果音合成手法PronounSEの評価 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 京都産業大学大学院/産業技術総合研究所 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 京都産業大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 東京科学大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 産業技術総合研究所 | ||||||||||||||
| 著者名 |
滝沢,力
× 滝沢,力
× 平井,重行
× 金崎,朝子
× 須田,仁志
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 人の調音器官(発音能力)に着目し,効果音の口真似を用いた効果音合成手法PronounSEが提案されている.この技術は,頭の中の音のイメージを口で表現し,それが効果音として合成されるものである.そして,爆発音に焦点を当てた口真似データセットを用いて学習されたPronounSEで,口真似の細かなニュアンス変化を反映した合成が実現されている.ただし,深層学習を用いた効果音・環境音合成に関する評価手法は確立されていないことから,Audio-to-Audioの合成技術に対し,「所望する音との類似性」と「口真似ニュアンスの反映性」の観点で評価を試みた.本研究では,それら評価の観点に関して客観評価と主観評価を実施し,その結果を報告する. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN10438388 | |||||||||||||
| 書誌情報 |
研究報告音楽情報科学(MUS) 巻 2025-MUS-143, 号 51, p. 1-7, 発行日 2025-06-06 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8752 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||