WEKO3
アイテム
状態空間の部分的高次元化手法を用いたマルチエージェント強化学習法
https://ipsj.ixsq.nii.ac.jp/records/50363
https://ipsj.ixsq.nii.ac.jp/records/5036360adacad-17ea-4fee-961a-7ba327bbe2c1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-03-16 | |||||||
タイトル | ||||||||
タイトル | 状態空間の部分的高次元化手法を用いたマルチエージェント強化学習法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Multi - Agent Reinforcement Learning with the Partly High - dimensional State Space | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋工業大学電気情報工学科 | ||||||||
著者所属 | ||||||||
名古屋工業大学電気情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Engineering, Nagoya Institute of Technology | ||||||||
著者名 |
藤田, 和幸
× 藤田, 和幸
|
|||||||
著者名(英) |
Kazuyuki, Fujita
× Kazuyuki, Fujita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | マルチエージェント強化学習では,エージェントは自分以外のエージェントも環境の一部として観測する.そのため,エージェント数の増加に伴い状態空間が指数的に増加し(次元の呪),学習速度を著しく低下させるという問題が生じる.この問題を解決する手法として提案されたModular Q-learningには,近くの不完全性により学習性能が低下する問題がある.本研究では状態空間の部分的高次元化手法を用いてModular Q-learningの学習性能を改善する手法を提案する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In Multi-Agent Reinforcement Learning, each agent observe a state of othe agents as a part of environment. Therefore, the state space is exponential in thenumber of agents and learning speed significantly decrease. Modular Q-learning[6] needs very small state space. However, the incomplete observation involves a decline in the performance. In this paper, we improve Modular Q-learning's performance with the partly high-dimensional state space. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2004, 号 29(2003-ICS-135), p. 95-100, 発行日 2004-03-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |