| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-02-22 |
| タイトル |
|
|
タイトル |
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SP1 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
LINEヤフー株式会社 |
| 著者所属 |
|
|
|
LINEヤフー株式会社 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
LY Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
LY Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者名 |
五十嵐, 琢斗
齋藤, 佑樹
関, 健太郎
高道, 慎之介
山本, 龍一
橘, 健太郎
猿渡, 洋
|
| 著者名(英) |
Takuto, Igarashi
Yuki, Saito
Kentaro, Seki
Shinnosuke, Takamichi
Ryuichi, Yamamoto
Kentaro, Tachibana
Hiroshi, Saruwatari
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,ノイジーな入力音声に対し,その音声品質と音響環境を表現する潜在変数の条件付けを行うノイズロバストな音声変換を提案する.先行研究では,クリーン音声に雑音や残響を人工的に付加することで得た疑似ノイジー音声のデータから noisy-to-clean の音声変換を学習する denoising training と呼ばれる手法により,既存のモデル構造に変更を加えることなく,ノイズロバストな音声変換を提案した.しかし,この手法は音声変換モデルが入力音声の多様な雑音や品質劣化を十分に学習できないため,推論時に未知ノイズで劣化した入力音声に対して,変換された音声の音韻や韻律が乱れる傾向にある.本研究では,入力音声の品質・雑音の多様性を解釈する機構を取り入れた音声変換を行うことを目的とし,denoising training の際に入力音声の音声品質および音響環境の潜在変数で条件付けたノイズロバストな音声変換の学習法を提案する.客観および主観評価により,提案手法により変換された音声の品質が従来手法と比較して向上することを示す. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2024-SLP-151,
号 3,
p. 1-6,
発行日 2024-02-22
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |