WEKO3
アイテム
DA3: マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証
https://ipsj.ixsq.nii.ac.jp/records/216461
https://ipsj.ixsq.nii.ac.jp/records/2164611b66e10d-73a9-4e53-bd8b-5b1f5f5fa0bd
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-02-14 | |||||||||
| タイトル | ||||||||||
| タイトル | DA3: マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 早稲田大学基幹理工学研究科知識ソフトウェア研究室 | ||||||||||
| 著者所属 | ||||||||||
| 早稲田大学基幹理工学研究科知識ソフトウェア研究室 | ||||||||||
| 著者名 |
元川, 善就
× 元川, 善就
× 菅原, 俊治
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 本稿では,マルチエージェント深層強化学習におけるノイズの影響度を学習し,自律的に抑制する distributed attentional actor architecture model for multi-agent system(DA3)を提案する.ノイズは多くの分野に存在し,長年の間その特性の解明や抑制手法が考案されてきた.特に,周囲の限られた情報をもとに他のエージェントとの協調・調整,さらに相互協力を前提とした互恵行動を獲得する必要のあるマルチエージェントシステムにおいても,ノイズ抑制や排除は重要な研究テーマである.本提案である DA3 は attention mechanism を内包しているため,エージェントは観測情報を取捨選択しながら環境に適応することが可能である.実験結果から,観測情報内のノイズや協調行動に無関係な第三者的エージェントに惑わされることなく,他エージェントとの協調行動を獲得し,attention mechanism を持たないベースライン (ここでは DQN) よりも高い学習性能を達成することを示す.また,DA3 内部に存在する attentional weights を解析することで,これまでブラックボックスとされてきたエージェントの行動決定過程におけるノイズの影響度などを把握できることを示す. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AA11135936 | |||||||||
| 書誌情報 |
研究報告知能システム(ICS) 巻 2022-ICS-205, 号 8, p. 1-8, 発行日 2022-02-14 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-885X | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||