方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜

五十嵐, 治一; 中村, 浩二; 福岡, 仁志; 石原, 聖司; Igarashi, Harukazu; Nakamura, Koji; Fukuoka, Hitoshi; Ishihara, Seji

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜

https://ipsj.ixsq.nii.ac.jp/records/97668

名前 / ファイル	ライセンス	アクション
IPSJ-GPWS2007020.pdf (686.3 kB)	Copyright (c) 2007 by the Information Processing Society of Japan
オープンアクセス

Item type

Symposium(1)

公開日

2007-11-09

タイトル

方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜

タイトル

言語

タイトル

Learning of Soccer Player Agents Using Policy Gradient Method〜Wall Pass after Free Kicks and Pass Selection in a Full Game〜

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

芝浦工業大学工学部

著者所属

芝浦工業大学工学部

著者所属

芝浦工業大学工学部

著者所属

近畿大学工学部

著者所属(英)

Shibahara Institute of Technology

著者所属(英)

Shibahara Institute of Technology

著者所属(英)

Shibahara Institute of Technology

著者所属(英)

Kinki University

著者名

五十嵐, 治一中村, 浩二福岡, 仁志石原, 聖司

著者名(英)

Igarashi, Harukazu Nakamura, Koji Fukuoka, Hitoshi Ishihara, Seji

論文抄録

内容記述タイプ

Other

内容記述

本研究は複数のエージェントによる協調行動の学習法の開発を目的としている．その題材としてRoboCupサッカーシミュレーションリーグにおけるゴール前でのフリーキックの問題と，フルゲーム中でのボールキープ問題とを取り上げた．行動決定にヒューリスティクスを用いるために，方策における知識表現が容易である方策勾配法を学習法として用いた．実験結果は2対2における壁パスが実現され，パスやドリブルによるボールキープに対して本方式が有効であることを示している．

論文抄録(英)

内容記述タイプ

Other

内容記述

This research developed a learning method for the coordination of multi-agents. We dealt with two problems in RoboCup Soccer Simulation games. The first problem is free kicks in front of the opponent goal. The second is pass selection during a game. The policy gradient method is applied as a learning method to solve the two problems because it can easily represent various heuristics for pass selection and pass receiving in a policy function. Experimental results show that our method effectively realizes wall passes after free kicks in 2 v 2 mini-games and clever pass selection of the four midfielders in a full game.

書誌情報

ゲームプログラミングワークショップ2007論文集

巻 2007, 号 12, p. 124-127, 発行日 2007-11-09

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 12:46:53.103352

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜

× 五十嵐, 治一中村, 浩二福岡, 仁志石原, 聖司

× Igarashi, Harukazu Nakamura, Koji Fukuoka, Hitoshi Ishihara, Seji

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜

× 五十嵐, 治一 中村, 浩二 福岡, 仁志 石原, 聖司

× Igarashi, Harukazu Nakamura, Koji Fukuoka, Hitoshi Ishihara, Seji

Versions

Share

Cite as

エクスポート

× 五十嵐, 治一中村, 浩二福岡, 仁志石原, 聖司