WEKO3
アイテム
深層強化学習を用いた多様な戦略を持つガイスタープレイヤーの作成への試み
https://ipsj.ixsq.nii.ac.jp/records/225271
https://ipsj.ixsq.nii.ac.jp/records/22527101786164-05f2-4c82-b23a-78dc38f409c4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-03-10 | |||||||||
タイトル | ||||||||||
タイトル | 深層強化学習を用いた多様な戦略を持つガイスタープレイヤーの作成への試み | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 強化学習 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
明治大学大学院 | ||||||||||
著者所属 | ||||||||||
明治大学 | ||||||||||
著者名 |
新堀, 和紀
× 新堀, 和紀
× 横山, 大作
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 本研究では,強さを保ったまま多様な戦略をとることができるガイスタープレイヤーを作成することを目指し,学習結果に多様性をもたらすような深層強化学習の実現を試みる.深層強化学習では各コンピュータプレイヤーを自己対局により学習させるが,初期配置に制約を与えて自己対局を行うことで,多様性のある戦略を学習させられるか,を検証する.戦略の多様性の指標としては,指し手の一致率,勝敗が決した時に満たされた勝利条件の割合を用いることとする.提案手法と,多用な戦略を学習する目的を持つ既存手法の Map-Elites によるガイスターのコンピュータプレイヤーを構築し,ランダムプレイヤーとの対戦を行い,勝率と戦略の多様性の両面から評価を行ったところ,提案手法はランダムな合法手を指すプレイヤーに対して最低でも 0.81 の勝率が得られ,作成したプレイヤーの 78% が勝率 0.9 を越えたが,MAP-Elite では最大でも 0.66 となった.また,4 つのプレイヤーが同一局面で同じ手を指す確率は,提案手法は 0.23 であり,MAP-Elite では Map-Elites では 0.017 であった.このことから提案手法では,Map-Elites より強く,Map-Elites には及ばない程度ではあるが,多様な戦略を持つプレイヤーを作成できることがわかった. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11362144 | |||||||||
書誌情報 |
研究報告ゲーム情報学(GI) 巻 2023-GI-49, 号 10, p. 1-8, 発行日 2023-03-10 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8736 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |