WEKO3
アイテム
距離ベース時間周波数マスク推定による音声強調手法の検討
https://ipsj.ixsq.nii.ac.jp/records/236023
https://ipsj.ixsq.nii.ac.jp/records/236023295ee68c-0e1b-4a50-892a-559fb3129031
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2024 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-03-01 | |||||||||||
タイトル | ||||||||||||
タイトル | 距離ベース時間周波数マスク推定による音声強調手法の検討 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 人工知能と認知科学 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
著者所属 | ||||||||||||
東工大 | ||||||||||||
著者所属 | ||||||||||||
東工大 | ||||||||||||
著者所属 | ||||||||||||
東京工業大/HRI-JP | ||||||||||||
著者名 |
石井, 遼平
× 石井, 遼平
× 中臺, 一博
× 糸山, 克寿
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 一般に会議では、複数の人が集まって話をするため、たとえ各話者の口元にマイクをつけて収録した場合でも、収録音には対象話者の音声に加え、他の話者の音声が混入してしまう。このため、収録音中の対象話者の音声の聴取が困難になり、議事録作成などの用途に支障をきたすという問題がある。本稿では、この問題を解決するため、ディープラーニングにより推定された時間周波数マスクを用いて、モノラル収録音から、近距離話者の音声のみを抽出する音声強調法を提案する。提案手法を人間の聴覚と相関があるPESQとSTOIを用いて評価した結果、提案手法の有効性を示すことができた。 | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN00349328 | |||||||||||
書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 361-362, 発行日 2024-03-01 |
|||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |