WEKO3
アイテム
兄弟節点の比較に基づく評価関数の調整
https://ipsj.ixsq.nii.ac.jp/records/97650
https://ipsj.ixsq.nii.ac.jp/records/976509462a974-4fa8-447c-960b-207850da43df
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-11-09 | |||||||
タイトル | ||||||||
タイトル | 兄弟節点の比較に基づく評価関数の調整 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning Evaluation Functions by Comparison of Sibling Nodes | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
東京大学大学院総合文化研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Arts and Sciences, The University of Tokyo | ||||||||
著者名 |
金子, 知適
× 金子, 知適
|
|||||||
著者名(英) |
Kaneko, Tomoyuki
× Kaneko, Tomoyuki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では兄弟節点の比較に基づく評価関数の調整方法を提案する.棋譜を教師例とした評価関数の調整は古くから行われており,最近ではあ兄弟節点の比較に基づくものが注目されている.特に,探索により最善応手手順を求めることと,求めた手順を元に重みを調整することを繰り返すことで良い評価関数が得られることが知られているが,計算時間がかかるという問題点がある.その計算時間は最善応手手順を求める時間がほとんどであるため,最善応手手順を効率良く求めることと,数値計算において求めた最善応手手順を有効に活用することで効率の改善を図り,Bradley-Terry モデルに基づいた指し手の並び替え及び絞り込みとロジスティック回帰を利用した重みの調整を行った.将棋を題材にした実験において,提案手法が有効であることを確認した.また,駒の重みを固定することで,さらに効率が向上することが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a framework for learning of evaluation functions. It compares the selected move and other moves in a database of game records, and adjusts weights by using logistic regression. The goal of the adjustment is that the evaluation function assigns higher value for the move selected by human player than the other legal moves. In the naive implementation of this framework, we needs to compute the PV nodes for each legal move in each position in the database, and its computational cost is very large. In order to remedy this problem, we selectively used the eective moves instead of using all the legal moves. The eectiveness of moves was automatically determined by the method based on Bradley-Terry model. The experiments on Shogi showed the eciency and eectiveness of our method. | |||||||
書誌情報 |
ゲームプログラミングワークショップ2007論文集 巻 2007, 号 12, p. 9-16, 発行日 2007-11-09 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |