2024-03-29T21:51:15Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001825002024-03-29T05:26:34Z01164:05305:09114:09209
花札の「こいこい」ゲームの強化学習によるコンピュータプレイヤjpnhttp://id.nii.ac.jp/1001/00182412/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=182500&item_no=1&attribute_id=1&file_no=1Copyright (c) 2017 by the Information Processing Society of Japan北陸先端科学技術大学院大学北陸先端科学技術大学院大学北陸先端科学技術大学院大学佐藤, 直之上原, 隆平池田, 心花札の 「こいこい」 ゲームは交互 2 人零和不完全情報ゲームの一種で,様々な媒体で多くの人に遊ばれているが研究例が少なく,人間の上級者に匹敵する人工プレイヤが開発されたという話も聞かない.そのため我々は強化学習の方策勾配法を用いて強い 「こいこい」 プレイヤの実装を試みた.まずはゲーム知識に基づいた高級な特徴量を人間が設計し,その重み付き線形和モデルで状態行動の価値を推測して学習を行った.その結果,ランダム行動プレイヤとルールベースプレイヤを上回る強さを獲得した.さらに我々は,状態行動の価値により複雑なモデルを適用すれば更に高い性能が引き出せると考えて,その準備のための実験のみを本稿で行った.ゲームに関する低級な特徴量を設計して,それが ANN の学習を通じて適切にゲームの最終スコア予測のために利用できそうな事を確かめた.AA11362144研究報告ゲーム情報学(GI)2017-GI-386172017-07-082188-87362017-07-04