2024-03-28T18:17:43Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000574892023-04-27T10:00:04Z01164:05159:05210:05211
複合的言語制約に基づくキーフレーズスポッティングによる対話音声理解Speech Understanding Based on Key - Phrase Spotting and Combined Language Modelsjpnhttp://id.nii.ac.jp/1001/00057489/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=57489&item_no=1&attribute_id=1&file_no=1Copyright (c) 2000 by the Information Processing Society of Japan京都大学情報学研究科京都大学情報学研究科鹿島, 博晶河原, 達也キーフレーズスポッティングに基づく頑健な対話音声理解において、統計的言語モデルと記述文法を組み合わせて適用する方式を提案する。本研究では、キーフレーズ内にはタスクに関する記述文法、キーフレーズ外には類似タスクの対話コーパスによる単語2-gramを適用する。これにより、キーフレーズ外に対しても比較的強い言語的制約を与えることができ、タスクに関する意味理解に直結するキーフレーズを高精度に抽出することができる。さらに抽出された複数のキーフレーズ候補に対し、フレーズ間の記述文法を適用することにより、頑健な対話音声理解を実現する。ホテル検索対話システムを用いて収集したデータに対して、文単位の記述文法による方式と比較し、文法内、文法外いずれの発話においても理解率の向上が確認された。We propose combined N-gram models and descriptive grammars used in key-phrases spotting for robust speech understanding. We apply task dependent descriptive grammars to inside of key-phrases and word bigram models trained on similar task dialogue corpus to others. The combined language models for whole of sentence improve the accuracy in detecting key-phrases. Furthermore connecting key-phrase hypotheses based on inter key-phrases grmmars realize robust speech understanding. The proposed approach was tested on data collected from realworld dialogue system on hotel retrieval task. The speech understanding strategy improves the accuracy in handling both in-grammar and out-of-grammar utterances over the conventional decoding approaches.AN10442647情報処理学会研究報告音声言語情報処理(SLP)2000119(2000-SLP-034)2332382000-12-212009-06-30