WEKO3
アイテム
話者・音素特徴に基づくマルチチャネル音声分離
https://ipsj.ixsq.nii.ac.jp/records/205216
https://ipsj.ixsq.nii.ac.jp/records/20521610bfbd4b-fbfe-4c53-ab22-2527e79c6dc2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2020 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2020-02-20 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | 話者・音素特徴に基づくマルチチャネル音声分離 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
キーワード | ||||||||||||||||
主題Scheme | Other | |||||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
京大 | ||||||||||||||||
著者所属 | ||||||||||||||||
京大 / 理研 | ||||||||||||||||
著者所属 | ||||||||||||||||
産総研 | ||||||||||||||||
著者所属 | ||||||||||||||||
理研 | ||||||||||||||||
著者所属 | ||||||||||||||||
京大 / 理研 | ||||||||||||||||
著者名 |
Yicheng, Du
× Yicheng, Du
× 關口, 航平
× 坂東, 宜昭
× Aditya, Arie Nugraha
× 吉井, 和佳
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | 代表的なブラインド音源分離手法であるマルチチャネル非負値行列因子分解 (MNMF) では,音源モデルと空間モデルが重要な役割を果たしている.最近、NMFに基づく低ランク音源モデルの代わりに、DNNに基づく深層音源モデルを用いた半教師あり音源分離手法が提案されている.本研究では,話者特徴と音素特徴の二種類の潜在変数を内包する深層音源モデルを定式化し,各空間内での話者や音素の分離度が高くなるような学習法を提案する。任意話者の混合音を用いた実験により,提案手法の有用性を検証する. | |||||||||||||||
書誌レコードID | ||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||
収録物識別子 | AN00349328 | |||||||||||||||
書誌情報 |
第82回全国大会講演論文集 巻 2020, 号 1, p. 193-194, 発行日 2020-02-20 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |