WEKO3
アイテム
既存評価関数のパラメタを活かした適応学習
https://ipsj.ixsq.nii.ac.jp/records/97714
https://ipsj.ixsq.nii.ac.jp/records/97714f3f078a6-2c72-4478-934b-5f6f6c826c8e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-11-06 | |||||||
タイトル | ||||||||
タイトル | 既存評価関数のパラメタを活かした適応学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Adaptive Learning Utilizing Parameters of Existing Evaluation Function | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
東京大学大学院工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学 IRT 研究機構 | ||||||||
著者所属 | ||||||||
東京大学大学院工学系研科究 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IRT Research Initiative, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, The University of Tokyo | ||||||||
著者名 |
矢野, 友貴
× 矢野, 友貴
|
|||||||
著者名(英) |
Yano, Yuki
× Yano, Yuki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | コンピュータゲームプレイヤの評価関数のパラメタ調整において, 新たに特徴を加えて学習を行う際, パラメタを零から調整し直すのが一般的である. パラメタを零から調整し直すということは, 今まで蓄えてきた知識を持つ既存パラメタを捨てることを意味する. 一方, データマイニングや自然言語処理の分野では関連性の高いドメインの既存パラメタを活用して調整を行うドメイン適応という手法が研究されており, 高い成果を上げている. 本稿では, ドメイン適応の手法を評価関数のパラメタ調整に導入することで既存パラメタを活かす学習手法を提案する. 本手法を用いて将棋の評価関数のパラメタ調整を行ったところ, 単純に既存パラメタを初期値等に用いる手法に比べて総合成績で勝る結果を得ることに成功した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | When new features are added to evaluation functions of computer game players, their parameters are usually tuned from scratch. This, however, means throwing out existing parameters which should reflect already acquired knowledge. On the other hand, for data mining and natural language processing, domain adaptation methods have made successes, which utilize existing parameters already tuned for related domains as the basis of parameter tuning. In this paper, we propose a method to utilize existing parameters as the basis for tuning a new evaluation function with added features, adopting the ideas of domain adaptation. We applied this method to tune evaluation function for shogi and have shown that a player tuned with our method showed better results against players tuned with more straightforward methods. | |||||||
書誌情報 |
ゲームプログラミングワークショップ2009論文集 巻 2009, 号 12, p. 1-8, 発行日 2009-11-06 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |