| Item type |
SIG Technical Reports(1) |
| 公開日 |
2019-02-19 |
| タイトル |
|
|
タイトル |
RoboCupサッカー2Dシミュレーションの守備行動での強化学習における報酬設計の検討 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
電気通信大学情報理工学部総合情報学科 |
| 著者所属 |
|
|
|
現在,電気通信大学大学院情報理工学研究科情報学専攻 |
| 著者所属 |
|
|
|
現在,電気通信大学大学院情報理工学研究科情報学専攻 |
| 著者所属 |
|
|
|
現在,電気通信大学大学院情報理工学研究科情報学専攻 |
| 著者名 |
阿部, 宇志
清, 雄一
田原, 康之
大須賀, 昭彦
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,世界で行われているサッカーの試合において,セットプレーの重要性が高まっており,攻撃やその攻撃に対する守備戦略においてアイデアが求められている.セットプレーにおいては,攻撃に関して様々な工夫をもたらしてゴールを奪い取るチームが見受けられるが,それに対して最善の守備行動について確立されたチームは多いとは言えない.そこで本稿では,ロボットで行うサッカー大会として知られる RoboCup サッカーのプログラムを使用し,コーナーキックの守備における最善行動についての研究を行った.ここでは,それぞれのエージェントがコーナーキックの守備において点を取られないことに適した行動を選択するようにするため,方策オン型 TD 学習と分類される強化学習の一つである Sarsa [3] のアルゴリズムを用いて,提案するプログラム設計と先行研究でのプログラム設計との比較を行うこととした.また,Q 値を選手間で共有することや,ヒューリスティクスを導入した強化学習 [2] を行うことで,学習効果向上を検討する実装も行った. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11135936 |
| 書誌情報 |
研究報告知能システム(ICS)
巻 2019-ICS-193,
号 10,
p. 1-7,
発行日 2019-02-19
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-885X |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |