@techreport{oai:ipsj.ixsq.nii.ac.jp:00056800, author = {翠, 輝久 and 河原, 達也 and Teruhisa, MISU and Tatsuya, KAWAHARA}, issue = {129(2007-SLP-069)}, month = {Dec}, note = {自然言語テキストで記述された文書を検索・提示する音声対話システムにおける対話戦略のオンライン学習を用いた最適化・適応手法を提案する.このようなシステムでは,音声認識結果の N-best 候補やコンテキスト情報を適切に利用することで,音声認識誤りや発話中の省略表現に対処できる可能性がある.また応答方法に関しても,確認の生成条件や情報の提示方法において,いくつかの選択肢が考えられる.本研究では,これらの生成可能な応答候補の中から最適なものを選択する過程を,情報提示の報酬と情報提示に直接関係しない時間に基づくペナルティを用いて定義されるベイズリスクを最小化する枠組みとして定式化を行う.本手法はオンライン学習により,音声認識率や検索の成功率に応じて適切に対話戦略を適応させることが可能である.観光情報の検索・提示を行うシステム「京都版ダイアログナビ」において対話戦略の学習・適応の実験を行った.評価の結果,ランダムに与えた初期値から最適なパラメータを獲得したり,システム環境の変化に対して対話戦略を適切に変化させられることを確認した., We propose an efficient dialogue management and its learning method for an information navigation system based on a document knowledge base. It is expected that incorporation of appropriate N-best candidates of ASR and contextual information will improve the system performance. The system also has several choices in generating responses or confirmations. In this paper, this selection is optimized as minimization of Bayes risk based on reward for correct information presentation and penalty for redundant turns. The proposed strategy is adaptively tuned by online learning, considering the ASR performance and the success rate of retrieval. We have evaluated this strategy with our spoken dialogue system “Dialogue Navigator for Kyoto City”, which also has question-answering capability. Effectiveness of the proposed framework is confirmed through an experiment with a large amount of utterances of real users.}, title = {文書検索システムにおけるベイズリスクに基づく対話戦略のオンライン学習}, year = {2007} }