WEKO3
アイテム
対戦相手に合わせた評価関数の学習システム
https://ipsj.ixsq.nii.ac.jp/records/58628
https://ipsj.ixsq.nii.ac.jp/records/5862841a440bb-b287-43d9-b951-1b804427b250
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-10-26 | |||||||
タイトル | ||||||||
タイトル | 対戦相手に合わせた評価関数の学習システム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | The learning system of evaluation function against the opponent | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学大学院理工学研究科 | ||||||||
著者所属 | ||||||||
東京農工大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東京農工大学工学部 | ||||||||
著者所属 | ||||||||
早稲田大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Science and Engineering, Waseda University | ||||||||
著者名 |
加藤, 俊明
× 加藤, 俊明
|
|||||||
著者名(英) |
Toshiaki, Kato
× Toshiaki, Kato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、TD(λ)法を用いた駒の価値や駒の位置による価値を学習する研究がいくつか行われ、成果を上げている。今までは、いかに人の感覚に近い価値を学習できるかということのみが問題にされて来た。しかし、そろそろ評価関数が自動的に学習できることで何が可能になるかを考えても良いのではないか。本論文では、相手に合わせた評価関数の微調整への可能性を探る。ただし、相手との直接対局で学習を行うのは現実的ではないので、相手の情報を別のシステムにまとめる必要があった。そこで、今回はそのシステムを評価関数に反映させたときに適切な学習が行われるかを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, some studies of learning the elements of evaluation function with TD(λ) were made and got to enough results. Till now, we only considered whether the outcome fitted with the thinking of human. But by now, we may be in the place where we can study what we do with the learning of evaluation function. In this paper, we search the way of adjusting evaluation function against the opponent as a new possibility by the learning with TD(λ). | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11362144 | |||||||
書誌情報 |
情報処理学会研究報告ゲーム情報学(GI) 巻 2000, 号 98(2000-GI-004), p. 37-40, 発行日 2000-10-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |