Item type |
SIG Technical Reports(1) |
公開日 |
2022-02-22 |
タイトル |
|
|
タイトル |
対話履歴の韻律情報を考慮した共感的対話音声合成 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SLP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
LINE株式会社 |
著者所属 |
|
|
|
東京大学 |
著者名 |
西邑, 勇人
齋藤, 佑樹
高道, 慎之介
橘, 健太郎
猿渡, 洋
|
著者名(英) |
Yuto, Nishimura
Yuki, Saito
Shinnosuke, Takamichi
Kentaro, Tachibana
Hiroshi, Saruwatari
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,対話履歴の言語・韻律情報を考慮し,対話相手に寄り添った発話を合成可能な共感的対話音声合成の手法を提案する.音声コミュニケーションにおいて人間は,対話の言語的・韻律的特徴から文脈を理解し,適切な韻律で対話相手に応答できる.しかし,この振る舞いをどのように計算機的に模擬し,音声合成に取り入れるかは詳細に検討されていない.提案法は,対話相手とエージェントの発話テキストと音声からクロスモーダル注意機構により推定される対話文脈埋め込みベクトルで音声合成の音響モデルを条件付けする.本研究ではさらに,対話履歴の文脈を考慮した学習を容易にするためのカリキュラム学習も検討する.実験的評価の結果より,提案法が従来法と比較して合成音声の発話自然性・対話自然性の両方を改善させることを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-140,
号 16,
p. 1-6,
発行日 2022-02-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |