WEKO3
アイテム
方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜
https://ipsj.ixsq.nii.ac.jp/records/97668
https://ipsj.ixsq.nii.ac.jp/records/97668bb92792c-e375-4fba-b6df-104ea04611e2
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2007-11-09 | |||||||
| タイトル | ||||||||
| タイトル | 方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Learning of Soccer Player Agents Using Policy Gradient Method〜Wall Pass after Free Kicks and Pass Selection in a Full Game〜 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| 芝浦工業大学工学部 | ||||||||
| 著者所属 | ||||||||
| 芝浦工業大学工学部 | ||||||||
| 著者所属 | ||||||||
| 芝浦工業大学工学部 | ||||||||
| 著者所属 | ||||||||
| 近畿大学工学部 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Shibahara Institute of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Shibahara Institute of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Shibahara Institute of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kinki University | ||||||||
| 著者名 |
五十嵐, 治一
中村, 浩二
福岡, 仁志
石原, 聖司
× 五十嵐, 治一 中村, 浩二 福岡, 仁志 石原, 聖司
|
|||||||
| 著者名(英) |
Igarashi, Harukazu
Nakamura, Koji
Fukuoka, Hitoshi
Ishihara, Seji
× Igarashi, Harukazu Nakamura, Koji Fukuoka, Hitoshi Ishihara, Seji
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本研究は複数のエージェントによる協調行動の学習法の開発を目的としている.その題材としてRoboCupサッカーシミュレーションリーグにおけるゴール前でのフリーキックの問題と,フルゲーム中でのボールキープ問題とを取り上げた.行動決定にヒューリスティクスを用いるために,方策における知識表現が容易である方策勾配法を学習法として用いた.実験結果は2対2における壁パスが実現され,パスやドリブルによるボールキープに対して本方式が有効であることを示している. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This research developed a learning method for the coordination of multi-agents. We dealt with two problems in RoboCup Soccer Simulation games. The first problem is free kicks in front of the opponent goal. The second is pass selection during a game. The policy gradient method is applied as a learning method to solve the two problems because it can easily represent various heuristics for pass selection and pass receiving in a policy function. Experimental results show that our method effectively realizes wall passes after free kicks in 2 v 2 mini-games and clever pass selection of the four midfielders in a full game. | |||||||
| 書誌情報 |
ゲームプログラミングワークショップ2007論文集 巻 2007, 号 12, p. 124-127, 発行日 2007-11-09 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||