WEKO3
アイテム
人の認知バイアスを応用した強化学習手法による適応的な学習について
https://ipsj.ixsq.nii.ac.jp/records/181066
https://ipsj.ixsq.nii.ac.jp/records/181066aa55d6df-7a42-4a5b-89fa-a50991a82c38
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2017 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2017-03-16 | |||||||||
| タイトル | ||||||||||
| タイトル | 人の認知バイアスを応用した強化学習手法による適応的な学習について | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 人工知能と認知科学 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
| 資源タイプ | conference paper | |||||||||
| 著者所属 | ||||||||||
| 日大 | ||||||||||
| 著者所属 | ||||||||||
| 日大 | ||||||||||
| 著者名 |
樋口, 将大
× 樋口, 将大
× 浦上, 大輔
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 我々の研究グループでは、人の認知バイアスを応用した強化学習手法である「LS-Q」を提案している。これまでの研究成果として、鉄棒ロボットの運動獲得をテスト課題として、LS-Qの実環境における有効性が明らかになっている。一方、鉄棒ロボットの状態遷移は複雑であるため、学習過程を詳細に観察することは不向きで、LS-Qの特性には不明な点が多くある。本研究では、より単純で解析が容易な「ツリーバンディット課題」にLS-Qを適用し、その学習能力を検証した。シミュレーションの結果、状態ごとの報酬の設定値の差が小さい場合や、学習の途中で報酬の設定値を変更した場合でも、LS-Qは適応的に学習できることが確認された。 | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN00349328 | |||||||||
| 書誌情報 |
第79回全国大会講演論文集 巻 2017, 号 1, p. 611-612, 発行日 2017-03-16 |
|||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||