WEKO3
アイテム
行動価値に着目した学習分類子システムの改善:マルチエージェント強化学習への接近
https://ipsj.ixsq.nii.ac.jp/records/10300
https://ipsj.ixsq.nii.ac.jp/records/10300cb86b66f-1abf-4abe-9f3f-94bf7c517d98
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-05-15 | |||||||
タイトル | ||||||||
タイトル | 行動価値に着目した学習分類子システムの改善:マルチエージェント強化学習への接近 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of Learning Classifier System by Action-value Function toward Multi-agent Reinforcement Learning | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:マルチエージェントの理論と応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | エージェント学習システム | |||||||
著者所属 | ||||||||
ATR ネットワーク情報学研究所 | ||||||||
著者所属 | ||||||||
ATR ネットワーク情報学研究所 東京工業大学大学院総合理工学研究科 | ||||||||
著者所属 | ||||||||
ATR ネットワーク情報学研究所 京都大学情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Network Informatics Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Network Informatics Laboratory,Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Network Informatics Laboratory,Graduate School of Informatics, Kyoto University | ||||||||
著者名 |
井上, 寛康
× 井上, 寛康
|
|||||||
著者名(英) |
Hiroyasu, Inoue
× Hiroyasu, Inoue
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまでで最も改善された学習分類子システムであるXCS は,決定的状態遷移からなる環境でのみ正しく動作することが知られている.本論文では,決定的状態遷移環境よりも複雑なマルチエージェント環境でも利用できる学習分類子システムを目指し,適切な経験の一般化が可能なXCS-QT を提案する.そしてその優位性をシミュレーション実験により示す.具体的には木の問題および追跡問題を用いて実験し,マルチエージェント環境はXCS にとって正しく動作できないいくつかの要因が含まれていること,およびXCS-QT がそれら要因を克服することを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | XCS is the newest Learning Classifier System (LCS), and at present it can only be used for deterministic transition environments. This paper proposes XCS-QT as a modified LCS that can appropriately generalize its experience and can be used for multi-agent environments that are more complex than deterministic transition environments. We then show the system’s advantage via simulation experiments using quasi-tree problems and hunter problems. Through the experiments, we demonstrate that there are several reasons why XCS cannot work very well in multi-agent environments, and that XCS-QT can overcome those problems. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 47, 号 5, p. 1483-1492, 発行日 2006-05-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |