Item type |
Symposium(1) |
公開日 |
2021-11-06 |
タイトル |
|
|
タイトル |
対局状況をより正確に表現するための盤面評価値 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Value Function for a more accurate representation of the game situation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
コンピュータ将棋 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者名 |
小川, 竜欣
池田, 心
|
著者名(英) |
Ogawa, Tatsuyoshi
Ikeda, Kokolo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ゲーム AI は将棋,囲碁,チェスなどのボードゲームで人間よりも強くなったが,人間を楽しませるという点から見ると,残された課題は多い.トッププレイヤに勝てるようなゲーム AI をそのまま対局に使用すると人間には理解できない高度な手を示され,探索に手を加えると人間では考えられないミスが発生してしまう.また,最近ではプロ棋士の対局で局面の評価値が示されることも多いが,人間プレイヤの実感または実際と乖離した評価値が示されることもある.本稿では,盤面から勝率を予測する教師あり学習を行う際に,棋力も入力に含めることで,より人間らしい局面の評価を目指す.また,推定した勝率の性能を確かめるため,指し継ぎによる評価を行った.指し継ぎには,人間的な評価項目を採用している技巧 2 を用いた.探索の深さを制限した弱い AI による指し継ぎの勝敗は,我々のモデルの予測勝率のほうが,強い AI の予測勝率よりも近かった.また,同一局面で入力レートが変わる場合に予測勝率が大きく異なる局面やほとんど等しい局面をサンプリングして,局面の解釈を行った.その結果,このサンプリング方法で逆転が起こりやすい局面や起こりにくい局面をある程度抽出することができた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Game AI has become stronger than humans in board games such as Shogi, Go, and chess. How-ever, in terms of entertaining humans, there are still many issues to be solved. If a game AI that can beat top players is used as is, it will show advanced moves that humans cannot understand. If we weaken the ability to search for the game AI, it will make mistakes that humans cannot imagine. Recently, evaluation values of professional players’ games are shown. However, the evaluation values sometimes deviate from the human player’s feelings or reality. In this paper, we aim for a more human-like evaluation of the game by including the player’s ability as an input in the supervised learning process to predict the winning percentage from the position. To verify the performance of the estimated probability of winning, we evaluate the probability by weak Shogi AI simulating. For the evaluation, we used Gikou 2, which uses human-like evaluation items. The predicted win rate of our model was closer to the predicted win rate of the strong AI than to that of the weak AI with limited search depth. We also sampled positions in which the predicted winning percentage differed greatly or were almost equal when the input rate changed in the same positions and then interpreted the positions. As a result, we were able to extract the positions where comebacks are likely to occur and those where they are unlikely to occur to some extent using this sampling way. |
書誌情報 |
ゲームプログラミングワークショップ2021論文集
巻 2021,
p. 28-33,
発行日 2021-11-06
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |