@techreport{oai:ipsj.ixsq.nii.ac.jp:00069918, author = {吉野, 幸一郎 and 河原, 達也 and Koichiro, Yoshino and Tatsuya, Kawahara}, issue = {20}, month = {Jul}, note = {本研究では、日々更新される Web テキストに対して、述語項構造に着目した情報抽出を行い、その内容を扱う対話システムについて述べる。本対話システムは、述語項構造により抽出された情報に基づいて、対話の履歴とトピックモデルを利用しながら、ユーザの質問に対応する情報を答える質問応答と、ユーザの要求・興味に沿った情報をプロアクティブに提示する情報推薦を行う。本稿ではこのようなシステムの実現可能性を示すため、プロ野球のニュース記事というドメインに限定してシステムを構築し、その評価を行った。また、こうした対話の枠組みを実現するために、対話のドメインごとに有用な述語項構造パターンをコーパスから教師なしで自動抽出する手法を提案し、その評価を行った。, In this paper, we present a novel scheme of spoken dialogue systems which uses the up-to-date information on the web. The scheme is based on information extraction which is defined by the predicate-argument (P-A) structure and realized by shallow parsing. Based on the information structure, the dialogue system can perform question answering and also proactive information presentation using the dialogue context and a topic model. Feasibility of this scheme is demonstrated with experiments using a domain of baseball news. In order to automatically select useful domain-dependent P-A structures, information-theoretic criteria are introduced, resulting to a completely unsupervised learning of the information structure given a corpus.}, title = {Webからの情報抽出を用いた音声対話システム}, year = {2010} }