WEKO3
アイテム
ミニマックス戦略と相手モデル探索の混合戦略:tictactoeによるセミランダムと勝負手探索を題材として
https://ipsj.ixsq.nii.ac.jp/records/58657
https://ipsj.ixsq.nii.ac.jp/records/58657357f50ce-cb56-4418-bc8c-4be1634bd6a1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-03-07 | |||||||
タイトル | ||||||||
タイトル | ミニマックス戦略と相手モデル探索の混合戦略:tictactoeによるセミランダムと勝負手探索を題材として | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Mixed Strategy of Minimax Strategy and Opponent - Model Search: a case study using a semi - random play and its speculative play on tictactoe | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
静岡大学情報学部 | ||||||||
著者所属 | ||||||||
静岡大学情報学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Shizuoka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Shizuoka University | ||||||||
著者名 |
梶原, 羊一郎
× 梶原, 羊一郎
|
|||||||
著者名(英) |
Yoichiro, Kajihara
× Yoichiro, Kajihara
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿はミニマックス戦略と相手モデル探索の混合戦略を論じる.そのために,tictactoeのゲームを用いて,セミランダムプレイとそれに対する勝負手探索の融合を検討する.セミランダムプレイの手法は先読みが導入されたランダムプレイであり,ゲームの終了状態だけが考慮される.この手法により,実力の異なる様々なプレイヤのモデル化が可能になる.次に,セミランダムプレイに対する勝負手探索を提案する.tictactoeを用いた自動プレイによる実験で,提案する勝負手探索の有効性を確認する.同時に,勝負手探索を限られたタイミングで用いると仮定した状況で,どのように戦略を制御すべきかを検討する.これらの結果が,一般の二人零和ゲームにおいて,ミニマックス戦略と相手モデル探索の混合戦略を構築する際に,有意義な示唆を与える. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper explores the control of strategies for game playing: the minimax strategy and the opponent-model search or more generally a speculative strategy. It first describes a search strategy for game playing called semi-random self-play that is a search strategy using random decisions and a look-ahead search for end goals only, by which a model of players with different strength may be obtained. Some experiments of semi-random self-play are performed using the simple two-person perfect-information game TICTACTOE. In the experiments a computer program plays against itself many games using semi-random self-play with various search depths. We then explore the use of speculative play against semi-random self-play. This search strategy is a variant of opponent-model search, and is applied against a player using semi-random self-play. We implemented such a speculative play in a simple TICTACTOE program. Experiments performed confirm the effectiveness of the proposed speculative strategy. Moreover, we consider which situation to apply the specualtive strategy if one player is allowed to use such speculative strategy on some limited times in a game. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
情報処理学会研究報告ゲーム情報学(GI) 巻 2000, 号 27(1999-GI-002), p. 93-100, 発行日 2000-03-07 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |