WEKO3
アイテム
Keepawayタスクにおけるマルチエージェントの協調行動の学習
https://ipsj.ixsq.nii.ac.jp/records/61661
https://ipsj.ixsq.nii.ac.jp/records/61661508e9ae5-3965-4217-91d4-1d6d948e3ff5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-03-02 | |||||||
タイトル | ||||||||
タイトル | Keepawayタスクにおけるマルチエージェントの協調行動の学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning Multiagent Coordinated Behavior in Keepaway Task | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科 | ||||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computational Intelligence and Systems Science Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and echnology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computational Intelligence and Systems Science Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computational Intelligence and Systems Science Tokyo Institute of Technology | ||||||||
著者名 |
伊佐野, 勝人
× 伊佐野, 勝人
|
|||||||
著者名(英) |
Shoto, Isano
× Shoto, Isano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | RoboCupサッカーシミュレーションのKeepawayタスクに関する多くの研究では、協調行動を獲得するためにボールを持ったプレイヤに強化学習を適用している。本研究では、 従来研究の分析から、 ボールを持ったプレイヤの能力を改善するために、新しい報酬関数を提案し、プレイヤがとりうる行動としてドリブルを追加した。さらに、ボールを持たないプレイヤにも強化学習を適用した。これらの拡張により、 ボールを奪われる割合が減少し、ボールを持たないプレイヤがボールを持ったプレイヤの動きの変化に柔軟に対応できるようになった。この結果、10秒以下のキープ時間の発生回数が従来研究よりも大幅に減少した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Most researches on Keepaway task of RoboCup have applied reinforcement learning to the player with a ball to get a coordinated behavior. In this paper, from an analysis of early studies, we suggested to add a new reward function and a new dribble skill to expand the ability of the player with a ball. In addition, we focused on the players without a ball and applied reinforcement learning to them too. As the effect of these techniques, the probabilities of interception and mistakes to pass a ball were decreased, and the player without a ball was able to cope flexibly with the change of the player with a ball behavior. As a result, the occurrences of keep time under 10 seconds were clearly lower than earlier studies. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2009, 号 27(2009-GI-21), p. 55-62, 発行日 2009-03-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |