Item type |
Symposium(1) |
公開日 |
2021-11-06 |
タイトル |
|
|
タイトル |
強化学習によるエージェントの戦術獲得の分析 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Analysis of Acquisition of Strategies for Agents in Reinforcement Learning |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
強化学習 |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
マルチエージェント |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
自己対戦 |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
戦術 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
立教大学大学院人工知能科学研究科 |
著者所属 |
|
|
|
立教大学大学院人工知能科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Rikkyo University,Graduate School of Artificial Intelligence and Sciences |
著者所属(英) |
|
|
|
en |
|
|
Rikkyo University,Graduate School of Artificial Intelligence and Sciences |
著者名 |
長友, 結希
三宅, 陽一郎
|
著者名(英) |
YUKI, NAGATOMO
YOUICHIRO, MIYAKE
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,ゲーム内のエージェント(キャラクター)に強化学習によって自律的に戦術を獲得させる手法の確立を探求する.このような自律的な戦術の獲得は,複雑化するゲーム開発において自動的なキャラクターAIの生成につながるものとして期待することができる.本研究でデモとして提示するのは,対戦型サッカーゲームであり,動的な環境の中でキャラクターが自ら最適な行動のみならず戦術を獲得する結果を提示する.強化学習のフレームワークとしてはUnity ML-Agents に実装された MA-POCA を用いる.強化学習は一般的にゲームスコアを伸ばす方向に開発されるが,本実装ではスコア自体よりもエージェントが新たな戦術を発見することに着目している.また,エージェントの移動ログを解析することで学習を通じてエージェントが戦術を獲得していくことを可視化した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this research, we inquire into the establishment of a method for autonomously acquiring tactics by reinforcement learning for agents (characters) in the game. The autonomous acquisition of strategies can be expected to lead the automatic generation of character AI in complicated game development. In this study, we used a competitive soccer game in which the characters acquire not only the optimal behavior but also the strategies. As the framework of the reinforcement learning, we used MA-POCA implemented in Unity ML-Agents. Reinforcement learning is generally developed toward increasing the game score, but this study focuses on the agent discovering new strategies rather than the score itself. In addition, by analyzing the movement log of the agent, it was visualized that the agents acquired tactics through learning. |
書誌情報 |
ゲームプログラミングワークショップ2021論文集
巻 2021,
p. 106-110,
発行日 2021-11-06
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |