ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ゲーム情報学(GI)
  3. 2023
  4. 2023-GI-49

制御可能な深層強化学習ゲームキャラクターAI

https://ipsj.ixsq.nii.ac.jp/records/225273
https://ipsj.ixsq.nii.ac.jp/records/225273
4998619e-3bf1-4acf-b5b5-0f688e0b4ba9
名前 / ファイル ライセンス アクション
IPSJ-GI23049012.pdf IPSJ-GI23049012.pdf (1.2 MB)
Copyright (c) 2023 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2023-03-10
タイトル
タイトル 制御可能な深層強化学習ゲームキャラクターAI
タイトル
言語 en
タイトル Controllable deep reinforcement learning game character AI
言語
言語 jpn
キーワード
主題Scheme Other
主題 強化学習
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
立教大学大学院人工知能科学研究科
著者所属
立教大学大学院人工知能科学研究科
著者所属(英)
en
Rikkyo University, Graduate School of Artificial Intelligence and Sciences
著者所属(英)
en
Rikkyo University, Graduate School of Artificial Intelligence and Sciences
著者名 李, 子龍

× 李, 子龍

李, 子龍

Search repository
三宅, 陽一郎

× 三宅, 陽一郎

三宅, 陽一郎

Search repository
著者名(英) Shiryuu, Ri

× Shiryuu, Ri

en Shiryuu, Ri

Search repository
Youichiro, Miyake

× Youichiro, Miyake

en Youichiro, Miyake

Search repository
論文抄録
内容記述タイプ Other
内容記述 オープンワールドのような複雑なゲーム環境で,AI 開発者が記述する規則は環境状況のステートを網羅することは困難である,ディープラーニングを用いることで反復学習により複雑な環境データに適応することができる.しかし,主流のディープラーニングアルゴリズムは,開発者に特定の制御の追加やカスタマイズが困難なため,商業レベルのゲーム内の Character AI の技術として直接利用することは難しい.本提案は強化学習の一つである PPO をベースにし,モジュール化したニューラルネットワークを使用することで,一つのモデルに複数の Policy を保存させ,指定した Target によって適切な Policy を基づき動作を選択できる手法を提案する.それと同時に,各 Policy への個別な変更,追加,削除も実現できた.以上の方法により,可制御性とカスタマイズ性を持つ深層強化学習 AI を提案する.
論文抄録(英)
内容記述タイプ Other
内容記述 In complex game environments such as open worlds, rules written by AI developers are difficult to cover the state of the environment situation, deep learning can be used to adapt to complex environmental data through iterative learning. However, mainstream deep learning algorithms are difficult to use directly as a technique for Character AI in commercial-level games because it is difficult for developers to add or customize specific controls. This proposal is based on PPO, a type of reinforcement learning, and by using a modularized neural network, we propose a method that allows multiple Policies to be stored in a single model, and then selects the appropriate Policy based on the specified Target. At the same time, individual changes, additions, and deletions to each Policy could be realized. By using these methods, we propose a deep reinforcement learning AI with controllability and customizability.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11362144
書誌情報 研究報告ゲーム情報学(GI)

巻 2023-GI-49, 号 12, p. 1-8, 発行日 2023-03-10
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8736
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:51:31.492121
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3