WEKO3
アイテム
囲碁における勾配法を用いた確率関数の学習
https://ipsj.ixsq.nii.ac.jp/records/61657
https://ipsj.ixsq.nii.ac.jp/records/61657055771e9-7e47-4195-8bd0-32435fa3e0a9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-03-02 | |||||||
タイトル | ||||||||
タイトル | 囲碁における勾配法を用いた確率関数の学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Machine Learning of Probability Function in Game of Go by Gradient Method | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Advanced Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Advanced Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Advanced Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Advanced Institute of Science and Technology | ||||||||
著者名 |
松井, 利樹
× 松井, 利樹
|
|||||||
著者名(英) |
Toshiki, Matsui
× Toshiki, Matsui
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 囲碁の局面評価は非常に複雑であり特徴の数は膨大となる。そのため膨大なパラメータを人間が調整していく事は困難を極める。そこで本稿は機械学習のアプローチからこの問題を解決する。学習手法にはコンピュータ将棋において評価関数の学習に用いられている勾配法をコンピュータ囲碁に応用する。将棋と囲碁の学習で決定的に異なる点は,将棋では手の順序関係を学習できれば十分であったが,囲碁では確率分布を生成しなければいけないため比率まで考慮しなければいけない点にある。本稿では異なる二つの誤差関数を設計する事でこの問題を解決している。ベンチマークとして,現在世界最強の囲碁プログラムであるCrazy Stone で用いられている学習手法である「小数化-最大化」と比較実験を行った結果,大きな性能向上を確認できた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Programmer cannot make accurate an evaluation function because of enormous number of features. we solve that problem with a machine learning approach. we present gradient method for supervised learning of such an evaluation function from game records, based on a learning method for computer Shogi’s an evaluation function. It is enough to learn order relation of move in Shogi while in Go move evaluation should also be learned to generate a probability distribution. we solved these problem through the design of two error functions. we compare that method with Minorization-maximization that was used by Crazy Stone (the best program in the world). As a result of experiment, our method is more efficient than previous approaches, | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2009, 号 27(2009-GI-21), p. 33-40, 発行日 2009-03-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |