| Item type |
Symposium(1) |
| 公開日 |
2023-11-10 |
| タイトル |
|
|
タイトル |
HandyRLを用いたナポレオンAIの強化学習 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Reinforcement Learning of Napoleon AI using HandyRL |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
不完全情報ゲーム |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
トランプ |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ナポレオン |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
HandyRL |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
強化学習 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
松江工業高等専門学校 |
| 著者所属 |
|
|
|
松江工業高等専門学校 |
| 著者所属(英) |
|
|
|
en |
|
|
National Institute of Technology, Matsue College |
| 著者所属(英) |
|
|
|
en |
|
|
National Institute of Technology, Matsue College |
| 著者名 |
高木, 利幸
橋本, 剛
|
| 著者名(英) |
Takaki, Toshiyuki
Hashimoto, Tsuyoshi
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ナポレオンは 5 人で行う日本のトランプゲームで,多人数不完全情報ゲームに分類される.特徴としてチーム戦であることがあげられるが,各プレイヤーに異なる役割が与えられ,敵味方の判別が難しいなど複雑なゲーム性を有している.本研究では,HandyRL を用いた強化学習によってナポレオン AI を作成することで,ナポレオンにおける強化学習の有効性を検証する.ナポレオンでは味方と協力し,チームとしての利益を最大化する必要がある.そこで,即時報酬に着目し,チームプレイを考慮する AI と考慮しない AI を作成した.チームプレイを考慮しない AI は,個人のポイントは増加したものの,チームの勝利に大きな影響を与えることはなかった.一方,チームプレイを考慮する AI は,味方にポイントを渡すなどのチームで協力する行動をとり,その結果として勝率が上昇した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Napoleon is a five-player Japanese card game, classified as a multiplayer incomplete information game. It is a complex game in that each player is assigned a different role and it is difficult to distinguish friend from foe. In this study, we examine the effectiveness of reinforcement learning in Napoleon by creating a Napoleon AI with reinforcement learning using HandyRL. In Napoleon, it is necessary to cooperate with allies to maximize the team’s profit. Therefore, we focused on immediate rewards and created an AI that considers team play and an AI that does not consider team play. The AI without consideration of team play increased individual points, but did not have a significant impact on the team’s victory. On the other hand, the AI with team-play considerations took actions to cooperate with the team, such as giving points to a teammate, and as a result, the winning rate increased. |
| 書誌情報 |
ゲームプログラミングワークショップ2023論文集
巻 2023,
p. 154-160,
発行日 2023-11-10
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |