WEKO3
アイテム
複数の雑音抑圧手法を用いた認識結果の統合による ロバスト音声認識の検討
https://ipsj.ixsq.nii.ac.jp/records/57169
https://ipsj.ixsq.nii.ac.jp/records/57169bd48567a-9290-4495-a7ff-8f9264f30206
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-12-18 | |||||||
タイトル | ||||||||
タイトル | 複数の雑音抑圧手法を用いた認識結果の統合による ロバスト音声認識の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Integration of Recognition Results for Robust Speech Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者名 |
岡田, 治郎
山田, 武志
北脇, 信彦
× 岡田, 治郎 山田, 武志 北脇, 信彦
|
|||||||
著者名(英) |
Jiro, Okada
Takeshi, Yamada
Nobuhiko, Kitawaki
× Jiro, Okada Takeshi, Yamada Nobuhiko, Kitawaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 様々な雑音条件に対してロバストな音声認識を実現するためには,複数の雑音抑圧手法の各々の認識結果から信頼度の高いものを選択する方法が有効であると考えられる.本稿では,フレーム正規化対数尤度に基づく信頼度を用いた認識結果の統合法を提案する.提案法では,正解と最もマッチする認識結果を得るために,各雑音抑圧手法を用いた時のN-bestの認識結果を求める.そして,各認識結果に対して信頼度を付与し,信頼度が最大になるものを選択する.提案法の有効性を評価するために,雑音下連続数字認識タスクであるAURORA-2Jを用いて評価実験を行った.その結果,特にMulticondition trainingの場合に提案法の有効性を認識することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To achieve high recognition performance in noisy environments, we proposes the integration of recognition results obtained by using reduction algorithms (spectral subtraction with smoothing of time direction, temporal domain SVD-based speech enhancement, GMM-based speech estimation and KLT-based comb-filtering). In the proposed method, the log likelihood-based confidence measure is used to select the best recognition result. Experimental results on the AURORA-2J connected digit recognition task confirmed that the proposed algorithm achieves high recognition performance especially in the multicondition training. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 124(2003-SLP-049), p. 109-114, 発行日 2003-12-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |