WEKO3
アイテム
マルチエージェント強化学習における全エージェントの経験を用いた状態空間削減手法の検討
https://ipsj.ixsq.nii.ac.jp/records/194916
https://ipsj.ixsq.nii.ac.jp/records/194916748d2703-7e30-42be-89f6-0db8d2d1fd0e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2019 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2019-03-02 | |||||||||||
タイトル | ||||||||||||
タイトル | マルチエージェント強化学習における全エージェントの経験を用いた状態空間削減手法の検討 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
筑波大学システム情報工学研究科/産業技術総合研究所 | ||||||||||||
著者所属 | ||||||||||||
筑波大学システム情報工学研究科/産業技術総合研究所 | ||||||||||||
著者所属 | ||||||||||||
産業技術総合研究所 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
University of Tsukuba / National Institute of Advanced Industrial Science and Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
University of Tsukuba / National Institute of Advanced Industrial Science and Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
National Institute of Advanced Industrial Science and Technology | ||||||||||||
著者名 |
岡野, 拓哉
× 岡野, 拓哉
× 大西, 正輝
× 野田, 五十樹
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 強化学習及びマルチエージェント強化学習は学習に非常に多くの時間を要することが知られている.マルチエージェント強化学習では,複数のエージェントが同時に学習行動を行うため,各エージェントが得た知識を共有,活用することで,学習を高速化することが期待できる.そこで,本研究では,各エージェントから得られた経験を用いて,状態の次元削減を行うオートエンコーダを構築し,そのオートエンコーダを用いて状態空間の次元削減を行うことで,学習速度の高速化を図る手法を提案する.提案手法を Task Allocation Problem 及び,交通信号機制御問題において評価し,通常の Independent Deep Q Learner に比べ学習速度が向上することを確認する. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AA11135936 | |||||||||||
書誌情報 |
研究報告知能システム(ICS) 巻 2019-ICS-194, 号 3, p. 1-6, 発行日 2019-03-02 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-885X | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |