@techreport{oai:ipsj.ixsq.nii.ac.jp:00157977, author = {竹内, 聖悟 and Shogo, Takeuchi}, issue = {8}, month = {Mar}, note = {強いプレイヤを作成するために,将棋を始めとした様々なゲームで棋譜からの学習が行われており,学習のためのデータ生成も研究課題となっている.例えば将棋の学習への利用を目的とした,局面と指手のペアの生成の研究がある.この研究の中で,教師例となる指手の質が重要であることが述べられている.従来は,深い探索によって得られる指手を教師として利用しているが,1 つのプログラム,特にそれが学習するプログラムと同じ場合,局所解に陥り,適当でないことがある.ところで,教師例となる指手の生成は対局後に行うため,対局中とは異なった様々なリソース,時間や他のプログラムなど,を使うことが可能である.本研究では,学習の教師となる質の高い指手の選択を目的として,複数プログラムを用いる探索を提案する.対象の局面を各プログラムで探索し,次に各プログラムの最善手を指した局面から探索を行う.この探索結果から各自の最善手を決定する手法である.複数プログラムの利用により,読み抜けを防ぎ,質を高めることができると考えられる.また,再帰的に上記の探索を行うことも可能であり,さらに質を高められると考えている.将棋を対象として提案手法の性能評価を行った.正答数の比較の結果から,単一プログラムの深い探索や異種合議と同程度の性能を確認した.また,複数プログラムを用いることで,単一プログラムだけでの探索よりも幅広く質の高い指手を探索していることを確認できた., Training parameters plays an important role in developing strong game programs. We required a large number of training positions and moves for the training. Thus, generating training data is an issue. Ura et al. reported that self-generated data may have a bad effect on the training. Therefore, we proposed a search method with two or more programs in order to avoid self-generation. Experimental results showed that performance of the proposed method is almost the same with the normal search and majority voting.}, title = {学習の教師例となる指手の選択を目的とした,複数プログラムを用いる探索についての考察}, year = {2016} }