WEKO3
アイテム
学習の教師例となる指手の選択を目的とした,複数プログラムを用いる探索についての考察
https://ipsj.ixsq.nii.ac.jp/records/157977
https://ipsj.ixsq.nii.ac.jp/records/157977b76849db-3698-42d2-9789-0a3e2b6b2e34
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2016-03-01 | |||||||
タイトル | ||||||||
タイトル | 学習の教師例となる指手の選択を目的とした,複数プログラムを用いる探索についての考察 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Search Method using a few Programs to Generate Moves for Training | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 探索などによる二人零和ゲームの合理的な戦略探求 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者名 |
竹内, 聖悟
× 竹内, 聖悟
|
|||||||
著者名(英) |
Shogo, Takeuchi
× Shogo, Takeuchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 強いプレイヤを作成するために,将棋を始めとした様々なゲームで棋譜からの学習が行われており,学習のためのデータ生成も研究課題となっている.例えば将棋の学習への利用を目的とした,局面と指手のペアの生成の研究がある.この研究の中で,教師例となる指手の質が重要であることが述べられている.従来は,深い探索によって得られる指手を教師として利用しているが,1 つのプログラム,特にそれが学習するプログラムと同じ場合,局所解に陥り,適当でないことがある.ところで,教師例となる指手の生成は対局後に行うため,対局中とは異なった様々なリソース,時間や他のプログラムなど,を使うことが可能である.本研究では,学習の教師となる質の高い指手の選択を目的として,複数プログラムを用いる探索を提案する.対象の局面を各プログラムで探索し,次に各プログラムの最善手を指した局面から探索を行う.この探索結果から各自の最善手を決定する手法である.複数プログラムの利用により,読み抜けを防ぎ,質を高めることができると考えられる.また,再帰的に上記の探索を行うことも可能であり,さらに質を高められると考えている.将棋を対象として提案手法の性能評価を行った.正答数の比較の結果から,単一プログラムの深い探索や異種合議と同程度の性能を確認した.また,複数プログラムを用いることで,単一プログラムだけでの探索よりも幅広く質の高い指手を探索していることを確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Training parameters plays an important role in developing strong game programs. We required a large number of training positions and moves for the training. Thus, generating training data is an issue. Ura et al. reported that self-generated data may have a bad effect on the training. Therefore, we proposed a search method with two or more programs in order to avoid self-generation. Experimental results showed that performance of the proposed method is almost the same with the normal search and majority voting. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2016-GI-35, 号 8, p. 1-5, 発行日 2016-03-01 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8736 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |