@techreport{oai:ipsj.ixsq.nii.ac.jp:00094545, author = {吉野幸一郎 and 森信介 and 河原達也}, issue = {4}, month = {Jul}, note = {音声対話システムのための音声認識における言語モデル構築のために、Web 上で集積される文から適切なものを選択する手法を提案し、評価する。従来手法では文表層のパープレキシティを用いた文選択が一般的であったが、提案手法では音声対話において利用される文書集合 (=ドメイン) との意味的な類似度を定義し、これを文選択に用いる。具体的には、ドメイン固有の述語項構造パターンに着目し、統語的な尺度を定義する。この意味的な類似度と従来のパープレキシティに基づく手法を組み合わせることも検討する。2 種類の異なるドメインにおける音声認識実験によって、提案する文選択手法が有効であることが示された。この際、文選択を行うために複数の分類器を検討し、比較評価を行った。この結果、特に既存手法と、ナイーブベイズ法による提案手法を組み合わせた場合に有意な音声認識精度の向上が見られ、音声対話システムの意味レベルの理解精度も向上することが確認された。}, title = {述語項構造を介したWebテキストからの文選択に基づく言語モデルの評価}, year = {2013} }