| Item type |
SIG Technical Reports(1) |
| 公開日 |
2021-10-12 |
| タイトル |
|
|
タイトル |
人間の知覚評価フィードバックによる音声合成の話者適応 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
H/SP/SLP |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者名 |
宇田川, 健太
齋藤, 佑樹
猿渡, 洋
|
| 著者名(英) |
Kenta, Udagawa
Yuki, Saito
Hiroshi, Saruwatari
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,人間の知覚評価をフィードバックに用いた多話者テキスト音声合成の話者適応を提案する.従来法では,話者識別によって事前学習した話者エンコーダを用いて目的話者の発話から話者埋め込みを抽出していた.しかし,従来法では参照音声を用意できない場合に目的話者の話者埋め込みを得ることができない.提案法では,探 索パラメータ空間の線分上から人間に一点を選択させることを繰り返して探索する Sequential Line Search を利用して,目的話者の話者埋め込みを探索する.また,話者埋め込み空間から音声を選択するためのシステムとして,音素ごと に複数の話者の音声を切り替えるシステムを開発した.これらのシステムの実験的評価では,客観評価と主観評価により提案法の有効性を検証する. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2021-SLP-138,
p. 1-6,
発行日 2021-10-12
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |