| Item type |
Symposium(1) |
| 公開日 |
2021-11-06 |
| タイトル |
|
|
タイトル |
General Game Playing における類似盤面を利用したモンテカルロ木探索性能向上の試み |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Towards an improvement of simulation strategy for Monte Carlo tree search using board similarities in General Game Playing |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
General Game Playing |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
モンテカルロ木探索 |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
類似盤面検出 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
明治大学大学院理工学研究科情報科学専攻 |
| 著者所属 |
|
|
|
明治大学大学院理工学研究科情報科学専攻 |
| 著者所属(英) |
|
|
|
en |
|
|
Department of Information Sciences Graduate School of Science and Technology, Meiji University |
| 著者所属(英) |
|
|
|
en |
|
|
Department of Information Sciences Graduate School of Science and Technology, Meiji University |
| 著者名 |
上宮, 佳晃
横山, 大作
|
| 著者名(英) |
Yoshiaki, Uemiya
Daisaku, Yokoyama
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
General Game Playing(GGP) とは、初見のゲームを、与えられるゲームルールだけで、高い精度でプレイするプログラムを実現することを目標とした問題カテゴリである。 様々な種類の未知のゲームをプレイするため、正確な評価関数を必要としないモンテカルロ木探索 (MCTS) を用いたプログラムが主流となっている。だが、汎用の実装を用いなければならないため、シミュレーション回数を増やさずに、MCTSの効率を向上させることが求められる。本論文では、GGP において少ないシミュレーション回数で MCTSの探索効率を向上させるために、シミュレーションの過程で得られる探索経験を利用した手法の有効性を検証し、その性能について議論する。実験により、拡張する盤面に対して探索経験から一致する盤面の情報を取得し、累積報酬と訪問回数を加算する手法は MCTS の探索効率を向上させることがわかった。 |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
General Game Playing(GGP) is a problem category what the goal is to create programs capable of playing the game which is never seen with high performance. Because of playing a wide variety of un-known games, using Monte Carlo Tree Search program which is not requires accurate evaluation function is main approach on GGP. However since general implementation must be used, it is needed to improve MCTS performance without increased simulation times. In this paper, to improve MCTS performance at small number of simulation times on GGP, we tested the effectiveness of the method used exploration experience which is created on simulationm and discuss the performance. By experimentation, the approach of to get information on the matching board from the exploration experience, and to add accumulated reward and visit count on expand node improves MCTS performance. |
| 書誌情報 |
ゲームプログラミングワークショップ2021論文集
巻 2021,
p. 172-178,
発行日 2021-11-06
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |