WEKO3
アイテム
不確定不完全情報展開型多人数ゲームにおける相手モデル化による搾取相手の選択
https://ipsj.ixsq.nii.ac.jp/records/78253
https://ipsj.ixsq.nii.ac.jp/records/78253bde2d25a-7266-4823-be24-11c9a3691236
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-11-04 | |||||||
タイトル | ||||||||
タイトル | 不確定不完全情報展開型多人数ゲームにおける相手モデル化による搾取相手の選択 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Opponent Exploitation by Opponent Modeling for Probabilistic Imperfect Information Extensive Multi-player games | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
東京大学大学院工学系研究科 | ||||||||
著者所属 | ||||||||
マンチェスター大学コンピュータ科学科 | ||||||||
著者所属 | ||||||||
東京大学大学院工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Computer Science, University of Manchester | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, The University of Tokyo | ||||||||
著者名 |
古居, 敬大
× 古居, 敬大
|
|||||||
著者名(英) |
Keita, Furui
× Keita, Furui
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ナッシュ均衡的な戦略は多人数ゲームでは有効な戦略であるが,非合理的なプレイヤが存在する場合には必ずしも最適な行動であるとは言えない.本稿では多人数ポーカーゲームにおいて,より搾取が可能であると予想されるナッシュ均衡戦略を取っていないプレイヤを判別し,そのプレイヤのみに応じた戦略を取るプレイヤについての提案する.実験を行ったところ,特定の単純な行動を取るプレイヤに対しては大きく搾取することができ,結果としてナッシュ均衡的な戦略をとったプレイヤより報酬が大きくなる場合があることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A Nash-equilibrium strategy is known to be effective for multi-player games, but this is not always the best strategy because of the existence of naive players. In this paper, we propose a game playing strategy for multi-player poker games. In this strategy, the player detects an opponent who dose not adopt the Nash-equilibrium strategy and exploits the opponent without considering the other opponents. Experimental result show the player with the proposed strategy was able to exploit a naive opponent and get more rewards than the e -Nash equilibrium player in some cases. | |||||||
書誌情報 |
ゲームプログラミングワークショップ2011論文集 巻 2011, 号 6, p. 46-53, 発行日 2011-10-28 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |