WEKO3
アイテム
雑音下音声認識のための複数の前処理手法の統合とそのAURORA - 2Jによる評価
https://ipsj.ixsq.nii.ac.jp/records/57231
https://ipsj.ixsq.nii.ac.jp/records/5723100f9acc3-b244-4bf4-a098-d9ffe0f45e02
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-07-18 | |||||||
タイトル | ||||||||
タイトル | 雑音下音声認識のための複数の前処理手法の統合とそのAURORA - 2Jによる評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Integration of Noise Reduction Algorithms for AURORA - 2J Task | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
名古屋大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
龍谷大学 | ||||||||
著者所属 | ||||||||
徳島大学 | ||||||||
著者所属 | ||||||||
信州大学 | ||||||||
著者所属 | ||||||||
和歌山大学 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Shinshu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者名 |
山田, 武志
× 山田, 武志
|
|||||||
著者名(英) |
Takeshi, Yamada
× Takeshi, Yamada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 様々な雑音条件下でロバストな音声認識を実現するためには,複数の雑音抑圧手法の統合が有効であると考えられる.本稿では,4つの雑音抑圧手法時間方向スムージングを用いたスペクトルサブトラクション法,時間領域SVDに基づく音声強調,GMMに基づく音声信号推定,ピッチ同期KLT)とそれらの組合せの有効性を,AURORA-2Jを用いて調べた.その結果,雑音条件によって最適な手法・組合せは異なっており,雑音条件に適したものを適宜選択することにより,認識性能を大幅に改善できることが明らかとなった.また,Multicondition trainingの場合は,雑音抑圧量を増やしても,必ずしも認識性能の改善につながらないことが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To achieve high recognition performance for a wide variety of noise and for a wide range of signal-to-noise ratios, this paper presents the integration of four noise reduction algorithms: spectral subtraction with smoothing of time direction, temporal domain SVD-based speech enhancement, GMM-based speech estimation and KLT-based comb-filtering. Recognition results on the AURORA-2J task show that the effectiveness of these algorithms and their combinations strongly depends on noise conditions, and excessive noise reduction tends to degrade recognition performance in multicondition training. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 75(2003-SLP-047), p. 95-100, 発行日 2003-07-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |