Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
LSTM-RNN音声合成における言語特徴量の時間的冗長性の削減に関する検討 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション3 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者名 |
チェ, ジェヒョン
五来, 丈瑠
小谷, 岳
齋藤, 大輔
峯松, 信明
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
従来の LSTM-RNNを用いた音声合成用の音響モデルでは言語特徴量を全フレームで入力し音響特徴量と一対一対応になっている.本研究では言語特徴量を特定の位置のみ入力し,LSTM-RNNの時間的特性を活用する上で入力の時間的冗長性を削減するモデルを提案する.合成音声を客観指標と聴取実験で評価した結果,提案モデルの合成音声が既存モデルの合成音声より比べて自然性が向上したことを確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-142,
号 45,
p. 1-6,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |