Item type |
Symposium(1) |
公開日 |
2015-10-30 |
タイトル |
|
|
タイトル |
コンピュータ囲碁におけるプレイアウト情報に基づく局面評価を用いたモンテカルロ木探索 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Monte Carlo Tree Search with Evaluation Function Using Playout Information for Computer Go |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
大阪電気通信大学大学院工学研究科 |
著者所属 |
|
|
|
大阪電気通信大学大学院工学研究科 |
著者所属 |
|
|
|
大阪電気通信大学情報通信工学部 |
著者所属(英) |
|
|
|
en |
|
|
Osaka Electro-Communication University, Information and Computer Science |
著者所属(英) |
|
|
|
en |
|
|
Osaka Electro-Communication University, Information and Computer Science |
著者所属(英) |
|
|
|
en |
|
|
Osaka Electro-Communication University, Department of Engineering Informatics |
著者名 |
田中, 一樹
徳重, 毅
藤田, 玄
|
著者名(英) |
Kazuki, Tanaka
Tsuyoshi, Tokushige
Gen, Fujita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
囲碁の局面評価は難しく,コンピュータ囲碁の局面評価関数の多くは,死活判定や探索範囲の広大さなどが原因で評価に時間がかかる.この問題に対し,本研究室では,UCT の中で着手決定に用いられるプレイアウトの終局盤面に注目し,終局状態の局面の統計情報を用い,少ない演算コストで盤面評価を行う手法を提案した.しかしこの手法では子ノード同士のUCB 値が違う場合に提案手法が有効でなくなどの問題があった.そこで本研究では,UCB 値の勝率項にプレイアウトの統計情報に基づく局面評価関数を組み合わせた手法を提案し,木探索の効率化を図る.既存手法であるFuego に提案手法を適用して性能評価を行った.提案手法の有効な範囲を調べるためにプレイアウト回数や持ち時間を変え評価を行った.その結果,少ないプレイアウト回数では,UCT 単独のFuego に対して6 割の勝率を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, a Monte Carlo tree search such as UCT for computer go have been widely known. On the other hand, an evaluation functions of the state of the game of computer go still tends to be heavy computational cost. In the previous study, we had proposed an efficient evaluation function which focus on results of play out based on UCT. However, the method had only limited effect, because UCB value was preserved. To cope with this problem, in this paper, an improved UCB value including a statistical information of results of playout. The evaluation results show some effectiveness of the proposed method. |
書誌情報 |
ゲームプログラミングワークショップ2015論文集
巻 2015,
p. 1-4,
発行日 2015-10-30
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |