@article{oai:ipsj.ixsq.nii.ac.jp:00079544,
 author = {吉野, 幸一郎 and 森, 信介 and 河原, 達也 and Koichiro, Yoshino and Shinsuke, Mori and Tatsuya, Kawahara},
 issue = {12},
 journal = {情報処理学会論文誌},
 month = {Dec},
 note = {日々更新されるWebニュースなどのテキストに対して,述語項構造に着目した情報抽出を行い,それに基づいて情報検索・推薦を行う音声対話システムについて述べる.まず,ドメインごとに有用な述語項構造パターンの抽出を行う指標を検討し,Naive Bayes法に基づく抽出が有効であることを示した.また,抽出された述語項構造に完全に一致するものがない場合でも情報推薦ができるように,前述の指標に基づいて述語項の優先度を決定し,さらに,要素・用言に関して関連度を定義することによって述語項どうしの類似度を計算する.評価実験において,音声情報検索における典型的な従来手法であるBag-Of-Words(BOW)モデルと比較して,本手法がより的確に応答生成を行えることが示された.上記に加えて,ユーザからの情報要求・発話がなくなった場合に,対話履歴中の述語項との類似度を利用してプロアクティブに情報提示を行う手法を提案する.本研究で提案する対話システムの枠組みは,述語項構造という普遍的な情報構造と,コーパスから獲得される類似度を利用しているので,高いドメイン移植性を有している., We propose a novel scheme of spoken dialogue systems which is capable of information presentation based on information extraction from large text data such as Web news using the predicate-argument (P-A) structure. Since P-A patterns are domain-dependent, we investigate a statistical measure for automatic selection of P-A patterns. Effective P-A patterns are successfully extracted using the Naive Bayes method. For flexible matching with the user's query, we define importance of each P-A pattern based on the above measure. We also calculate the relevance measure of predicates and that of arguments to define similarity of P-A patterns. Using these measures, the system is able to select most relevant information to the user's request. In an experimental evaluation, the proposed approach realized more appropriate information presentations than the conversational Bag-Of-Words (BOW) method. We also propose a proactive presentation method, based on the similarity of P-A patterns and the dialogue history, which is invoked when the system detects a user's long pause. The proposed scheme of spoken dialogue systems realizes high domain portability, as the P-A structure is a general information structure and the similarity of P-A patterns are automatically extracted from a corpus.},
 pages = {3386--3397},
 title = {述語項の類似度に基づく情報抽出・推薦を行う音声対話システム},
 volume = {52},
 year = {2011}
}