WEKO3
アイテム
拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識
https://ipsj.ixsq.nii.ac.jp/records/57454
https://ipsj.ixsq.nii.ac.jp/records/57454c0abf822-f47a-47bb-bc2b-cb679755aa4c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-12-21 | |||||||
タイトル | ||||||||
タイトル | 拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extended Kalman Particle filters applied to model - based noise compensation for noisy speech recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者名 |
姚開盛
× 姚開盛
|
|||||||
著者名(英) |
Kaisheng, Yao
× Kaisheng, Yao
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、ジャンプ・マルコフ状態空間モデルに基づく、雑音下の音声認識手法について述べる。このモデルでは雑音パラメータと状態列は隠れた変数として、計算ベイズアプローチによって推定する。本方法はモデルレベルの雑音補償法であり、時間的に変化する加算性雑音のパラメータを、モンテ・カルロ・パーティクル・フィルタを用いて推定する。パーティクルは各時刻における雑音の状態を表す空間(雑音状態空間)に相当する。概念的には、ある時刻のパーティクルは、音声認識中に得られる音響・言語モデルから計算される遷移確率に応じて、次の時刻の雑音状態空間の候補となる、新たな複数のパーティクルに確率的に遷移していくと考える。その際、大きい尤度の値を示すパーティクルは遷移先として、より多くの候補に展開され、小さな尤度を示すパーティクルは場合によっては、それ以上の展開は行わないと判定される。なお、それらの展開には拡張型カルマン・フィルタを用いる。雑音パラメータは、各状態空間の尤度に基づいて、最小2乗誤差推定法によって推定する。本稿では、予備的な実験として、本方法をN-bestリスコアリングに適用した結果を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We suggest viewing noisy speech recognition based on Jump Markov State Space model. In this model, noise parameters and state sequences are hidden and estimated by a computational Bayesian approach for parameter estimation. Particularly, the Monte-Carlo particle filters were adopted to estimate time-varying additive noise parameter for model-based noise compensation. Each particle corresponds to a certain state space of noise. The particles randomly transit to new state spaces of noise according to the transition probability given by acoustic models and language models for speech recognition. Higher likelihood particles generate larger number of new particles with newly evolved state space, whereas the lower likelihood particles may be stopped by a selection step. The state space after a particular transition was evolved using an extended Kalman filter. Likelihood of each state space contributes to Minimum Mean Square Error (MMSE) estimation of the noise parameter from all the particles. Primary experiments on N-Best rescoring are shown in this paper. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 119(2000-SLP-034), p. 25-30, 発行日 2000-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |