| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-03-10 |
| タイトル |
|
|
タイトル |
制御可能な深層強化学習ゲームキャラクターAI |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Controllable deep reinforcement learning game character AI |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
強化学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
立教大学大学院人工知能科学研究科 |
| 著者所属 |
|
|
|
立教大学大学院人工知能科学研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Rikkyo University, Graduate School of Artificial Intelligence and Sciences |
| 著者所属(英) |
|
|
|
en |
|
|
Rikkyo University, Graduate School of Artificial Intelligence and Sciences |
| 著者名 |
李, 子龍
三宅, 陽一郎
|
| 著者名(英) |
Shiryuu, Ri
Youichiro, Miyake
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
オープンワールドのような複雑なゲーム環境で,AI 開発者が記述する規則は環境状況のステートを網羅することは困難である,ディープラーニングを用いることで反復学習により複雑な環境データに適応することができる.しかし,主流のディープラーニングアルゴリズムは,開発者に特定の制御の追加やカスタマイズが困難なため,商業レベルのゲーム内の Character AI の技術として直接利用することは難しい.本提案は強化学習の一つである PPO をベースにし,モジュール化したニューラルネットワークを使用することで,一つのモデルに複数の Policy を保存させ,指定した Target によって適切な Policy を基づき動作を選択できる手法を提案する.それと同時に,各 Policy への個別な変更,追加,削除も実現できた.以上の方法により,可制御性とカスタマイズ性を持つ深層強化学習 AI を提案する. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In complex game environments such as open worlds, rules written by AI developers are difficult to cover the state of the environment situation, deep learning can be used to adapt to complex environmental data through iterative learning. However, mainstream deep learning algorithms are difficult to use directly as a technique for Character AI in commercial-level games because it is difficult for developers to add or customize specific controls. This proposal is based on PPO, a type of reinforcement learning, and by using a modularized neural network, we propose a method that allows multiple Policies to be stored in a single model, and then selects the appropriate Policy based on the specified Target. At the same time, individual changes, additions, and deletions to each Policy could be realized. By using these methods, we propose a deep reinforcement learning AI with controllability and customizability. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11362144 |
| 書誌情報 |
研究報告ゲーム情報学(GI)
巻 2023-GI-49,
号 12,
p. 1-8,
発行日 2023-03-10
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8736 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |