@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00097668, author = {五十嵐, 治一 and 中村, 浩二 and 福岡, 仁志 and 石原, 聖司 and Igarashi, Harukazu and Nakamura, Koji and Fukuoka, Hitoshi and Ishihara, Seji}, book = {ゲームプログラミングワークショップ2007論文集}, issue = {12}, month = {Nov}, note = {本研究は複数のエージェントによる協調行動の学習法の開発を目的としている.その題材としてRoboCupサッカーシミュレーションリーグにおけるゴール前でのフリーキックの問題と,フルゲーム中でのボールキープ問題とを取り上げた.行動決定にヒューリスティクスを用いるために,方策における知識表現が容易である方策勾配法を学習法として用いた.実験結果は2対2における壁パスが実現され,パスやドリブルによるボールキープに対して本方式が有効であることを示している., This research developed a learning method for the coordination of multi-agents. We dealt with two problems in RoboCup Soccer Simulation games. The first problem is free kicks in front of the opponent goal. The second is pass selection during a game. The policy gradient method is applied as a learning method to solve the two problems because it can easily represent various heuristics for pass selection and pass receiving in a policy function. Experimental results show that our method effectively realizes wall passes after free kicks in 2 v 2 mini-games and clever pass selection of the four midfielders in a full game.}, pages = {124--127}, publisher = {情報処理学会}, title = {方策勾配法を用いたサッカーエージェントの学習〜フリーキック時の壁パスとゲーム中のパス選択〜}, volume = {2007}, year = {2007} }