Item type |
SIG Technical Reports(1) |
公開日 |
2019-03-01 |
タイトル |
|
|
タイトル |
サッカーエージェントにおける方策勾配法とQ学習の同時適用 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
芝浦工業大学 |
著者所属 |
|
|
|
芝浦工業大学 |
著者所属 |
|
|
|
芝浦工業大学 |
著者所属 |
|
|
|
芝浦工業大学 |
著者所属(英) |
|
|
|
en |
|
|
Shibaura Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Shibaura Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Shibaura Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Shibaura Institute of Technology |
著者名 |
山岸, 準
五十嵐, 治一
山岸, 拓海
入倉, 雅春
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Robocupサッカーシミュレーション2Dリーグはソフトウェア同士がコンピュータ上でサッカーをするリーグである.オープンソースのagent2dのプレイヤエージェントは「chain action」という枠組みを実装しており,探索木と評価関数を用いてボールを保持した場合の行動決定を行っている.本研究では,評価関数の重みの学習に,エピソードベースの方策勾配法(PGL)と各時刻の行動価値の推定値を用いて学習することができるQ学習(QL)を併用して,効率的に学習することを試みた.その結果,agent2dに対してPGL,QLそれぞれ単独で学習させた勝率は4%と11%であったが,PGLとQLを組み合わせた勝率は43%となり,単独で学習したものと比べて大きく勝率が向上した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11362144 |
書誌情報 |
研究報告ゲーム情報学(GI)
巻 2019-GI-41,
号 4,
p. 1-6,
発行日 2019-03-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8736 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |