WEKO3
アイテム
役を構成するゲームに対する効率的な行動決定アルゴリズムの提案
https://ipsj.ixsq.nii.ac.jp/records/82817
https://ipsj.ixsq.nii.ac.jp/records/828178fde4a2a-878f-4702-aa61-54d273fc80d9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-07-06 | |||||||
タイトル | ||||||||
タイトル | 役を構成するゲームに対する効率的な行動決定アルゴリズムの提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Effective algorithm for decision making on hand-composing game | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東北大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tohoku University, GSIS | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tohoku University, GSIS | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tohoku University, GSIS | ||||||||
著者名 |
小松, 智希
× 小松, 智希
|
|||||||
著者名(英) |
Tomoki, Komatsu
× Tomoki, Komatsu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 探索空間が非常に広く,評価関数が作りにくいゲームにおいて行動決定を行う手法にモンテカルロ法があり,囲碁や大貧民などのゲームに対して有効な手法であることがわかってきた.しかし,麻雀のように探索空間全体に対して得点が得られる組み合わせが少ないゲームでは,モンテカルロ法は報酬を得ることができるプレイアウトの回数が少ないため,十分な効果を発揮することができない.本論文では,麻雀におけるモンテカルロ法の非効率性を実験的に検証する.また,プレイアウトにおいて効率的に報酬を得ることができる手法を提案し,モンテカルロ法と比較することで実験的に有効性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Monte Carlo methods have been successfully applied for playing games, and have outperformed previous algorithm in such games as Go and Daihinmin. However, as we will experimentally show, it is not very effective for some games like Mahjong, where random simulation can rarely get rewards. Without positive rewards, players have little reason to choose better actions. In this paper, we propose a new algorithm to overcome this difficulty. It virtually simulates many play-outs in each trial simultaneously, so that many of play-outs can get positive rewards, even for this kind of games. We show some preliminary experiments that convinced us that the approach is promising. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2012-GI-28, 号 8, p. 1-8, 発行日 2012-07-06 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |