ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. ゲームプログラミングワークショップ(GPWS)
  4. 2023

HandyRLを用いたナポレオンAIの強化学習

https://ipsj.ixsq.nii.ac.jp/records/229360
https://ipsj.ixsq.nii.ac.jp/records/229360
365f594c-1151-42f0-bf99-c88d9c81782e
名前 / ファイル ライセンス アクション
IPSJ-GPWS2023027.pdf IPSJ-GPWS2023027.pdf (1.2 MB)
Copyright (c) 2023 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2023-11-10
タイトル
タイトル HandyRLを用いたナポレオンAIの強化学習
タイトル
言語 en
タイトル Reinforcement Learning of Napoleon AI using HandyRL
言語
言語 jpn
キーワード
主題Scheme Other
主題 不完全情報ゲーム
キーワード
主題Scheme Other
主題 トランプ
キーワード
主題Scheme Other
主題 ナポレオン
キーワード
主題Scheme Other
主題 HandyRL
キーワード
主題Scheme Other
主題 強化学習
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
松江工業高等専門学校
著者所属
松江工業高等専門学校
著者所属(英)
en
National Institute of Technology, Matsue College
著者所属(英)
en
National Institute of Technology, Matsue College
著者名 高木, 利幸

× 高木, 利幸

高木, 利幸

Search repository
橋本, 剛

× 橋本, 剛

橋本, 剛

Search repository
著者名(英) Takaki, Toshiyuki

× Takaki, Toshiyuki

en Takaki, Toshiyuki

Search repository
Hashimoto, Tsuyoshi

× Hashimoto, Tsuyoshi

en Hashimoto, Tsuyoshi

Search repository
論文抄録
内容記述タイプ Other
内容記述 ナポレオンは 5 人で行う日本のトランプゲームで,多人数不完全情報ゲームに分類される.特徴としてチーム戦であることがあげられるが,各プレイヤーに異なる役割が与えられ,敵味方の判別が難しいなど複雑なゲーム性を有している.本研究では,HandyRL を用いた強化学習によってナポレオン AI を作成することで,ナポレオンにおける強化学習の有効性を検証する.ナポレオンでは味方と協力し,チームとしての利益を最大化する必要がある.そこで,即時報酬に着目し,チームプレイを考慮する AI と考慮しない AI を作成した.チームプレイを考慮しない AI は,個人のポイントは増加したものの,チームの勝利に大きな影響を与えることはなかった.一方,チームプレイを考慮する AI は,味方にポイントを渡すなどのチームで協力する行動をとり,その結果として勝率が上昇した.
論文抄録(英)
内容記述タイプ Other
内容記述 Napoleon is a five-player Japanese card game, classified as a multiplayer incomplete information game. It is a complex game in that each player is assigned a different role and it is difficult to distinguish friend from foe. In this study, we examine the effectiveness of reinforcement learning in Napoleon by creating a Napoleon AI with reinforcement learning using HandyRL. In Napoleon, it is necessary to cooperate with allies to maximize the team’s profit. Therefore, we focused on immediate rewards and created an AI that considers team play and an AI that does not consider team play. The AI without consideration of team play increased individual points, but did not have a significant impact on the team’s victory. On the other hand, the AI with team-play considerations took actions to cooperate with the team, such as giving points to a teammate, and as a result, the winning rate increased.
書誌情報 ゲームプログラミングワークショップ2023論文集

巻 2023, p. 154-160, 発行日 2023-11-10
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 11:34:15.694587
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3