Item type |
SIG Technical Reports(1) |
公開日 |
2022-11-22 |
タイトル |
|
|
タイトル |
内容語保存機構を備えた変分自己符号化器に基づくテキスト発話スタイル変換 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声認識(1) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋大学 |
著者所属 |
|
|
|
名古屋大学 |
著者所属 |
|
|
|
株式会社エーアイ |
著者所属 |
|
|
|
株式会社エーアイ |
著者所属 |
|
|
|
名古屋大学 |
著者所属(英) |
|
|
|
en |
|
|
NU |
著者所属(英) |
|
|
|
en |
|
|
NU |
著者所属(英) |
|
|
|
en |
|
|
AI Inc. |
著者所属(英) |
|
|
|
en |
|
|
AI Inc. |
著者所属(英) |
|
|
|
en |
|
|
NU |
著者名 |
吉岡, 大貴
安田, 裕介
松永, 悟行
大谷, 大和
戸田, 智基
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
テキスト音声合成(TTS)技術は発展し,通常の読み上げでは人間に近い自然性を達成している.次の課題として,感情やキャラクタ性などの「発話スタイル」を付与した音声の合成が盛んに研究されている.本稿では,「音声のスタイルだけでなく読み上げテキストのスタイルも制御可能な TTS」の実現に向けたテキストの発話スタイル変換を行う.ノンパラレルコーパスを用いた手法によるテキストスタイル変換においてコンテンツ保存性が不十分であることに着目し,条件付き変分自己符号化器に対して内容語保存機構を組み合わせることを提案する.また,提案手法に位置埋め込みやサイクル学習を導入することで,さらなる性能改善を試みる.日本語テキストのスタイル変換タスクを対象とした実験的評価の結果から,本手法の有効性を示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2022-NL-254,
号 8,
p. 1-6,
発行日 2022-11-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |