WEKO3
アイテム
時間領域SVDとGMMに基づく音声信号推定法の統合による 雑音下音声認識
https://ipsj.ixsq.nii.ac.jp/records/57246
https://ipsj.ixsq.nii.ac.jp/records/57246c42bb0e3-a296-491d-a595-7da52582a05d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-02-07 | |||||||
タイトル | ||||||||
タイトル | 時間領域SVDとGMMに基づく音声信号推定法の統合による 雑音下音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Recognition in Noise by Combination of Temporal Domain SVD Based Speech Enhancement and GMM Based Speech Estimation Method | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者名 |
藤本, 雅清
× 藤本, 雅清
|
|||||||
著者名(英) |
Masakiyo, Fujimoto
× Masakiyo, Fujimoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では,時間領域SVDに基づく音声強調法と,GMMに基づく音声信号推定法を併用した雑音に頑健な音声認識手法を提案する.GMMに基づく音声信号推定法において最も大きな問題点は,雑音の平均ベクトルの推定問題であり,本研究では,雑音の時間変動に追随して雑音の平均ベクトルを逐次更新することについて検討した.また,より高い音声認識精度を得るために,時間領域SVDに基づく音声強調法をGMMに基づく音声信号推定法の前処理として用いた.提案手法をAURORA2データベースを用いて評価した結果,全ての雑音環境で大幅な音声認識率の改善が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A noise robust speech recognition method by combination of temporal domain singular value decomposition(SVD) based speech enhancement and Gaussian mixture model(GMM) based speech estimation is proposed in this paper. The critical neck of GMM based approach is the noise estimation problem. For this noise estimation problem, we investigated the adaptive noise estimation in GMM based approach. Furthermore, in order to obtain higher recognition accuracy, we employed a temporal domain SVD based speech enhancement method as the pre-processing module of GMM based approach. In evaluation on the AURORA2 tasks, our method showed the significant improvement in recognition accuracy at all the noise conditions. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 14(2002-SLP-045), p. 7-12, 発行日 2003-02-07 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |