WEKO3
アイテム
アクション継続長制御を利用するPOMDP対話制御
https://ipsj.ixsq.nii.ac.jp/records/73270
https://ipsj.ixsq.nii.ac.jp/records/73270acd8b4ef-27ce-4565-8b00-013b323ce38d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-03-10 | |||||||
タイトル | ||||||||
タイトル | アクション継続長制御を利用するPOMDP対話制御 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | POMDP dialogue control using action durations | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories, NTT corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT corporation | ||||||||
著者名 |
南, 泰浩
× 南, 泰浩
|
|||||||
著者名(英) |
Yasuhiro, Minami
× Yasuhiro, Minami
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | この報告ではアクションの継続長制御を利用する POMDP による対話制御手法を提案する。我々は、これまで,POMDP による対話制御に,Trigram モデルによる統計的な対話制御を取り入れる手法を提案してきた。しかし,この手法は,対話タスクを自動的に学習することができる反面,高い確率を持っているアクションを過剰に生成する問題点があることが実験からわかってきた.本稿では,この問題点を解決するため POMDP を用いる対話制御において,アクション継続長の確率分布に従ってアクションを生成する手法を導入する。実験結果において,提案方法はアクションの Trigram 確率を高く保ちながら,偏りのないアクション生成を実現できることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a dialogue control method using action durations. We previously proposed a combined method of an ordinary POMDP-based method and a probability-based method and extended it to treat trigram dialogue control. When we apply this method to less task-oriented dialogues, the method over-generates actions that have high probabilities. To avoid this problem, we introduce duration control to our POMDP action generation process. The experimental results show that the proposed method can generate action sequences whose probability is similar to the training data and increase the entropy of the actions. This increase means that the action generation gives new information and avoids over-gererating the same actions. This confirms that our method generates appropriate action sequences. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
研究報告ヒューマンコンピュータインタラクション(HCI) 巻 2011-HCI-142, 号 3, p. 1-8, 発行日 2011-03-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |