WEKO3
アイテム
将棋の棋譜を利用した大規模な評価関数の学習
https://ipsj.ixsq.nii.ac.jp/records/71588
https://ipsj.ixsq.nii.ac.jp/records/71588d9a12688-2a3d-4dd4-ba8b-2f96ea44ffe5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-12-15 | |||||||
タイトル | ||||||||
タイトル | 将棋の棋譜を利用した大規模な評価関数の学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning of Evaluation Functions by Game Records in Shogi | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 創立50周年記念論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
東京大学大学院総合文化研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院総合文化研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Arts and Sciences, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Arts and Sciences, The University of Tokyo | ||||||||
著者名 |
金子, 知適
× 金子, 知適
|
|||||||
著者名(英) |
Tomoyuki, Kaneko
× Tomoyuki, Kaneko
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では兄弟節点の比較に基づく評価関数の調整方法について大規模な実験を行い議論する.将棋では近年,棋譜を教師とした評価関数の調整が注目を集めている.現在有望とされる手法では,最善応手手順の探索と,最善応手手順後の局面を比較した評価値の調整を繰り返すことで,棋譜の指手が探索結果と一致するように評価関数を調整する.本稿では,学習の際の損失関数の違いや訓練例の与え方が評価関数の学習に与える影響を,実験を通じて考察し議論する.さらに,実際に100万を超える特徴で学習させ,強いプログラムの評価関数の作成に成功したことを報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper discusses practical issues in learning of evaluation functions, based on comparison of moves that appeared in a database of game records. In the framework recently researched in shogi, the weights of evaluation functions are adjusted in such a way that the value of the move selected by human players become higher than that of alternative moves, where the value of a move is the evaluation value of a leaf position of the principal variation. In this paper, the effectiveness of four kinds of loss functions as well as other parameters in the framework are discussed. We also show that the weights of more than a million of the weights of the features were successfully adjusted in the method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 51, 号 12, p. 2141-2148, 発行日 2010-12-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |