Item type |
SIG Technical Reports(1) |
公開日 |
2022-02-22 |
タイトル |
|
|
タイトル |
アクセント潜在変数を用いた方言音声合成における文単位生成の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of sentence-level generation in Japanese dialect speech synthesis using accent latent variables |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SP2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, the University of Tokyo |
著者名 |
湯舟, 航耶
郡山, 知樹
高道, 慎之介
猿渡, 洋
|
著者名(英) |
Kazuya, Yufune
Tomoki, Koriyama
Shinnosuke, Takamichi
Hiroshi, Saruwatari
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
日本語方言音声合成は個人化された音声合成システムなどにとって有用であるが,アクセントラベルを用意できないことが合成音声の自然性を高める上での障害となっている.著者らは過去,アクセントラベルなしで日本 語方言のピッチアクセントを生成するため,vector quantized variational autoencoder (VQ-VAE) を用いて方言ピッチアクセントをモーラ単位のアクセント潜在変数としてモデル化する手法を提案し,フレーズ単位の発話に対して評価を行った.これに続き本稿では,修正した同様の手法を文単位の方言発話に適用し,その評価を行う.実験では, 文単位発話に対してもアクセント潜在変数によって音声のピッチアクセントをモデル化できること,単語分割の精度 が高い場合に提案法は従来法よりも自然なピッチアクセントをテキストから生成できること,提案法によって生成されるピッチアクセントの可制御性が向上することを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-140,
号 20,
p. 1-6,
発行日 2022-02-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |