@techreport{oai:ipsj.ixsq.nii.ac.jp:00069921, author = {翠, 輝久 and 杉浦, 孔明 and 大竹, 清敬 and 堀, 智織 and 柏岡, 秀紀 and 河井, 恒 and 中村, 哲 and Teruhisa, Misu and Komei, Sugiura and Kiyonori, Ohtake and Chiori, Hori and Hideki, Kashioka and Hisashi, Kawai and Satoshi, Nakamura}, issue = {23}, month = {Jul}, note = {本稿では,ユーザがシステムから情報提示・推薦を受けながら候補を選択する相談型の音声対話システムの枠組みについて述べる.嗜好に合った候補を選択する際には,多くの要因を考慮する必要がある.システムを利用するユーザは,そのような要因の全てを必ずしも把握しているわけではないため,システムはユーザに対して情報推薦を行い,知識のギャップを埋める必要がある.本研究では,このように複数の候補の中からユーザに適した候補を選択する相談型対話のモデルを提案する.京都観光案内タスクにおいて,観光スポットを決定する対話システムの実装を行い,被験者実験を行った.さらに,被験者実験で得られた対話データから,ユーザのシミュレータを作成し,自然政策勾配法を用いた強化学習を用いて対話戦略の最適化を行った., This paper addresses a spoken dialogue framework that helps users make decisions. Various decision criteria are involved in selecting from a given set of alternatives. Users often do not have a definite goal or criteria for selection, and thus the system has to bridge the knowledge gap and also recommend an appropriate alternative together with the reason for the recommendation through a dialogue. In this paper, we present a model for such consulting dialogue. In order to evaluate the model, we implement a trial sightseeing guidance system and conduct a user experiment. Then, we optimize the dialogue strategy through reinforcement learning with a natural policy gradient approach using a user simulator trained from the collected dialogue data.}, title = {相談型対話のモデル化と対話戦略の最適化}, year = {2010} }