Item type |
National Convention(1) |
公開日 |
2019-02-28 |
タイトル |
|
|
タイトル |
球面調和関数に基づく距離別分離音を用いた深層学習による近接音声分離 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
人工知能と認知科学 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
法大 |
著者所属 |
|
|
|
NTT |
著者所属 |
|
|
|
NTT |
著者所属 |
|
|
|
法大 |
著者名 |
西口, 草太
小泉, 悠馬
原田, 登
伊藤, 克亘
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
物理モデルと深層学習を組み合わせた新たな近接/遠方音声分離手法を提案する。一般的に、深層学習による音源分離ではディープニューラルネットワーク(DNN)を用いて時間-周波数(T-F)マスクを推定する。T-Fマスクを正確に推定するには真のT-Fマスクと強い相互関係を持つ音響特徴量が必要になる。一般的には各音声の声質や音韻の連続性の違いからマスクを推定する方法がとられている。しかし、似た声の話者音声に対しては分離性能が低下する。本論文では球面調和関数に基づく近接音分離法により、低周波数領域の近接/遠方音を推定し、これを音響特徴量に加える。これにより似た声質の複数話者音声分離の性能を向上し、なおかつ球面調和関数に基づく手法では扱えなかった高域成分の分離を実現した。提案手法は球面調和関数に基づく手法に比べて分離音源の信号対歪率が6–8dB改善された。 |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
書誌情報 |
第81回全国大会講演論文集
巻 2019,
号 1,
p. 557-558,
発行日 2019-02-28
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |