Item type |
SIG Technical Reports(1) |
公開日 |
2021-10-12 |
タイトル |
|
|
タイトル |
韻律情報で条件付けされた非自己回帰型End-to-End日本語音声合成の検討 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
H/SP/SLP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者名 |
藤井, 一貴
齋藤, 佑樹
猿渡, 洋
|
著者名(英) |
Kazuki, Fujii
Yuki, Saito
Hiroshi, Saruwatari
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
日本語音声合成において,合成音声のアクセントは合成音声の品質に大きく寄与するだけでなく,正確な情報伝達を行う上で重要な情報である.しかし,音素や文字などの生テキストに近い情報から音声を予測する End-to-End 日本語音声合成では,合成音声のアクセント誤りが頻出する.提案手法では非自己回帰型 End-to-End 音声合成モデルの代表である FastSpeech2 に入力する音素記号に,テキスト解析により得られた韻律情報を取り込むことで,アクセント誤りの改善を目指す.また,韻律情報を抽出する際のテキスト解析で用いる辞書の影響も調査する.実験的評価の結果より,提案手法が合成音声の韻律予測精度と自然性を有意に改善させることを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2021-SLP-138,
p. 1-6,
発行日 2021-10-12
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |