WEKO3
アイテム
Cross-Entropy Methodを用いたコンピュータ将棋における探索パラメータの学習
https://ipsj.ixsq.nii.ac.jp/records/80931
https://ipsj.ixsq.nii.ac.jp/records/80931432788eb-4428-48eb-91a5-6c6739227ef3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-02-24 | |||||||
タイトル | ||||||||
タイトル | Cross-Entropy Methodを用いたコンピュータ将棋における探索パラメータの学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning of Search Parameters using Cross-Entropy Method in Computer Shogi | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京農工大学大学院工学府 | ||||||||
著者所属 | ||||||||
東京農工大学工学研究院 | ||||||||
著者所属 | ||||||||
東京農工大学工学研究院 | ||||||||
著者名 |
松原, 徹
古宮, 嘉那子
小谷, 善行
× 松原, 徹 古宮, 嘉那子 小谷, 善行
|
|||||||
著者名(英) |
Toru, Matsubara
Kanako, Komiya
Yoshiyuki, Kotani
× Toru, Matsubara Kanako, Komiya Yoshiyuki, Kotani
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 将棋やチェスなどの思考ゲームが強いプログラムを作るためには,評価関数の精度と効率的な局面探索が必要であるとされている.複雑な評価関数のパラメータが機械学習に成功していることに比べ,静止探索の深さや Futility Pruning のマージンなどのパラメータは手動で決められていることが多く,最適な値であるとは言えない.そこで本研究ではこれらのパラメータを Cross-Entropy Method を用いて学習する手法を提案した.実験の結果,静止探索の深さや Aspiration 探索のウインドウ幅などのパラメータが良いと思われる値に収束した.また,学習したパラメータは人手による調整のパラメータに対して大きく勝ち越した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is considered that the accuracy of a evaluation function and efficient game-tree search are necessary to make a strong program of shogi and chess. Compared with the parameters of a complicated evaluation function, which have succeeded in machine learning, the searching parameters, such as the depth of quiescence search and a margin of Futility Pruning, are decided manually in many cases, and are not the optimal values. In this paper, we propose to apply the Cross-Entropy Method for learning these parameters. From the result of the experiment, some parameters converged as the value that seems to be good.Moreover, the learned parameters-based greatly won to the manual parameters-based. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2012-GI-27, 号 3, p. 1-8, 発行日 2012-02-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |