| Item type |
National Convention(1) |
| 公開日 |
2021-03-04 |
| タイトル |
|
|
タイトル |
アンサンブル時間周波数マスクによる音声強調手法の検討 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
人工知能と認知科学 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大 |
| 著者所属 |
|
|
|
東工大/ホンダRIJ |
| 著者名 |
藤田, 雅彦
糸山, 克寿
西田, 健次
中臺, 一博
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では, アンサンブル時間周波数マスクを用いたビームフォーミングに基づく音声強調手法を報告する. 従来の時間周波数マスクベースの音声強調手法は, 単一のキューから時間周波数マスク推定していたため,十分に入力信号に含まれる音声強調の鍵となる特徴量を活かしきれていなかった.そこで,異なるキューから推定される複数の時間周波数マスクを統合して処理のロバスト性を向上するアンサンブル時間周波数マスク法を提案する. 提案手法をCHiME3コーパスを使って, 人間の聴感と相関があるPESQとSTOIを用いて評価した. いずれの評価指標においても提案手法がアンサンブルを行わない既存手法を上回り, 提案手法の有効性を示した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
| 書誌情報 |
第83回全国大会講演論文集
巻 2021,
号 1,
p. 235-236,
発行日 2021-03-04
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |