ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ゲーム情報学(GI)
  3. 2016
  4. 2016-GI-35

学習の教師例となる指手の選択を目的とした,複数プログラムを用いる探索についての考察

https://ipsj.ixsq.nii.ac.jp/records/157977
https://ipsj.ixsq.nii.ac.jp/records/157977
b76849db-3698-42d2-9789-0a3e2b6b2e34
名前 / ファイル ライセンス アクション
IPSJ-GI16035008.pdf IPSJ-GI16035008.pdf (767.6 kB)
Copyright (c) 2016 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2016-03-01
タイトル
タイトル 学習の教師例となる指手の選択を目的とした,複数プログラムを用いる探索についての考察
タイトル
言語 en
タイトル Search Method using a few Programs to Generate Moves for Training
言語
言語 jpn
キーワード
主題Scheme Other
主題 探索などによる二人零和ゲームの合理的な戦略探求
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
北海道大学大学院情報科学研究科
著者名 竹内, 聖悟

× 竹内, 聖悟

竹内, 聖悟

Search repository
著者名(英) Shogo, Takeuchi

× Shogo, Takeuchi

en Shogo, Takeuchi

Search repository
論文抄録
内容記述タイプ Other
内容記述 強いプレイヤを作成するために,将棋を始めとした様々なゲームで棋譜からの学習が行われており,学習のためのデータ生成も研究課題となっている.例えば将棋の学習への利用を目的とした,局面と指手のペアの生成の研究がある.この研究の中で,教師例となる指手の質が重要であることが述べられている.従来は,深い探索によって得られる指手を教師として利用しているが,1 つのプログラム,特にそれが学習するプログラムと同じ場合,局所解に陥り,適当でないことがある.ところで,教師例となる指手の生成は対局後に行うため,対局中とは異なった様々なリソース,時間や他のプログラムなど,を使うことが可能である.本研究では,学習の教師となる質の高い指手の選択を目的として,複数プログラムを用いる探索を提案する.対象の局面を各プログラムで探索し,次に各プログラムの最善手を指した局面から探索を行う.この探索結果から各自の最善手を決定する手法である.複数プログラムの利用により,読み抜けを防ぎ,質を高めることができると考えられる.また,再帰的に上記の探索を行うことも可能であり,さらに質を高められると考えている.将棋を対象として提案手法の性能評価を行った.正答数の比較の結果から,単一プログラムの深い探索や異種合議と同程度の性能を確認した.また,複数プログラムを用いることで,単一プログラムだけでの探索よりも幅広く質の高い指手を探索していることを確認できた.
論文抄録(英)
内容記述タイプ Other
内容記述 Training parameters plays an important role in developing strong game programs. We required a large number of training positions and moves for the training. Thus, generating training data is an issue. Ura et al. reported that self-generated data may have a bad effect on the training. Therefore, we proposed a search method with two or more programs in order to avoid self-generation. Experimental results showed that performance of the proposed method is almost the same with the normal search and majority voting.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11362144
書誌情報 研究報告ゲーム情報学(GI)

巻 2016-GI-35, 号 8, p. 1-5, 発行日 2016-03-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8736
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 13:09:41.634114
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3