| Item type |
SIG Technical Reports(1) |
| 公開日 |
2021-02-24 |
| タイトル |
|
|
タイトル |
主観的話者間類似度を考慮したDNN話者埋め込みのためのActive Learning |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SLP1 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者名 |
齋藤, 佑樹
高道, 慎之介
猿渡, 洋
|
| 著者名(英) |
Yuki, Saito
Shinnosuke, Takamichi
Hiroshi, Saruwatari
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,主観的話者間類似度のスコアリングと,Deep Neural Network (DNN) を用いた話者埋め込みの学習を反復する active learning を提案する.我々はこれまでに,話者間類似度の主観スコアリング結果に基づく DNN 話者埋め込みの学習法を提案し,多話者音声生成における合成音声の品質と制御性の改善効果を確認している.しかしながら,この学習法は,主観スコアリングの作業コストと,話者埋め込み学習時の計算コストを要する.提案法では,DNN 話者埋め込みの学習に用いる話者間の主観的な類似度スコアが一部だけ観測されていると仮定し,(1) 観測されているスコアを用いた DNN 話者埋め込み学習と (2) 話者埋め込み由来の類似度に基づく優先度付きのスコアリングを反復する.実験的評価の結果より,提案法がコストを削減しつつ多話者音声生成モデリングに適した DNN 話者埋め込みを学習することを示す. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2021-SLP-136,
号 30,
p. 1-6,
発行日 2021-02-24
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |