@techreport{oai:ipsj.ixsq.nii.ac.jp:00216461, author = {元川, 善就 and 菅原, 俊治}, issue = {8}, month = {Feb}, note = {本稿では,マルチエージェント深層強化学習におけるノイズの影響度を学習し,自律的に抑制する distributed attentional actor architecture model for multi-agent system(DA3)を提案する.ノイズは多くの分野に存在し,長年の間その特性の解明や抑制手法が考案されてきた.特に,周囲の限られた情報をもとに他のエージェントとの協調・調整,さらに相互協力を前提とした互恵行動を獲得する必要のあるマルチエージェントシステムにおいても,ノイズ抑制や排除は重要な研究テーマである.本提案である DA3 は attention mechanism を内包しているため,エージェントは観測情報を取捨選択しながら環境に適応することが可能である.実験結果から,観測情報内のノイズや協調行動に無関係な第三者的エージェントに惑わされることなく,他エージェントとの協調行動を獲得し,attention mechanism を持たないベースライン (ここでは DQN) よりも高い学習性能を達成することを示す.また,DA3 内部に存在する attentional weights を解析することで,これまでブラックボックスとされてきたエージェントの行動決定過程におけるノイズの影響度などを把握できることを示す.}, title = {DA3: マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証}, year = {2022} }