@techreport{oai:ipsj.ixsq.nii.ac.jp:00057291, author = {LaneIanR. and 河原, 達也 and 松井, 知子 and 中村, 哲 and Ian, R.Lane and Tatsuya, Kawahara and Tomoko, Matsui and Satoshi, Nakamura}, issue = {121(2002-SLP-044)}, month = {Dec}, note = {複数ドメインの対話システムを構築するために話題同定と話題依存の言語モデルを用いた音声認識手法を提案する。本手法では、ユーザの発話(初期認識結果)から話題を自動的に検出し、その話題に依存した言語モデルを用いて(再度)音声認識を行う。これにより、ドメイン数に関係なく効率性を維持しながら、認識制度の改善を実現する。本稿では、unigram尤度とSVMに基づく話題同定法を実装・比較する。さらに、話題同定誤りに頑健に対処するため、階層的な言語もモデルの枠組みを提案する。本手法により、単一の言語モデルに比べて、単語誤り率が10.3%改善され、複数の言語モデルを並列に用いた場合と比べて、はるかに少ない計算量で同等の認識精度を得ることができた。, An efficient, scalable speech recognition architecture is proposed for multi-domain dialog systems by combining topic detection and topic-dependent language modeling. The inferred domain is automatically detected from the user's utterance, and speech recognition is then performed with an appropriate domain-dependent language model. The architecture improves accuracy and efficiency over current approaches and is scaleable to a large number of domains. In this paper, unigram likelihood and SVM based topic detection methods are compared. A novel framework using a multi-layer hierarchy of language models is also introduced in order to improve robustness against topic detection errors. The proposed system provides a relative reduction in WER of 10.3% over a single language model system. Furthermore, it achieves an accuracy that is comparable to using multiple language models in parallel while requiring only a fraction of the computational cost.}, title = {話題同定に基づく言語モデル切替による対話音声認識}, year = {2002} }