WEKO3
アイテム
Model-Based Wiener Filterによる雑音の種類に頑健な苫声認識
https://ipsj.ixsq.nii.ac.jp/records/56945
https://ipsj.ixsq.nii.ac.jp/records/569454e12d8cc-472f-405c-9548-b5372b010224
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-12-22 | |||||||
タイトル | ||||||||
タイトル | Model-Based Wiener Filterによる雑音の種類に頑健な苫声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Model-Based Wiener Filter for Noise Robust Speech Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属 | ||||||||
NECメディア情報研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NEC Media and Information Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NEC Media and Information Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NEC Media and Information Research Laboratories | ||||||||
著者名 |
荒川, 隆行
辻川剛範
磯谷亮輔
× 荒川, 隆行 辻川剛範 磯谷亮輔
|
|||||||
著者名(英) |
Takayuki, ARAKAWA
MasanoriTSUJIKAWA
RyosukeISOTANI
× Takayuki, ARAKAWA MasanoriTSUJIKAWA RyosukeISOTANI
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 雑音の種類に頑健な音声認識手法であるModel Based Wiener Filter法を提案する.本手法は,信号処理的手法であるWiener Filterと,音声GMMによるMMSE推定法を組み合わせたものである.AURORA2-Jタスクを用いて評価を行ったところ,ETSIの提唱するAdvanced Front-Endと較べて単語正解精度が平均値で同程度,雑音の種類によるばらつきでは3分の1程度となり,提案法が雑音の種類に頑健に動作することが確かめられた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a new approach for noise robust speech recognition, Model-Based Wiener Filter. This method takes three steps to estimate clean speech signals from noisy speech signals. The first step is the spectral subtraction (SS). Since the SS averagely subtracts noise components, the estimated speech signals often include distortion. In the second step, the distortion caused by SS is reduced using the minimum mean square error estimation for a Gaussian mixture model. In the final step, the Wiener Filtering is performed with the decision-directed method. Experiments are conducted using the AURORA2J database. The results show that the proposed method performs as well as the ETSI advanced front-end in average and the variation range of the recognition accuracy according to the kind of noise is about one third, which demonstrates the robustness of the proposed method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 127(2005-SLP-059), p. 151-152, 発行日 2005-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |