@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00175361, author = {齋藤, 雄太 and 鶴岡, 慶雅 and Yuta, Saito and Yoshimasa, Tsuruoka}, book = {ゲームプログラミングワークショップ2016論文集}, month = {Oct}, note = {事前知識を用いない多人数不完全情報ゲームのAIの学習は、人工知能を現実世界の問題に応用する上で非常に重要な課題の一つである。本研究では、多人数不完全情報ゲームの一種であるトリックテイキングゲームの行動価値観数を線形関数で近似し、Q学習を行った。その結果、トリックテイキングゲームにQ学習を適用することで単純なルールベースのプレイヤに勝る結果が得られること、自己対戦による学習を行うことで、ランダムプレイヤによる学習を行った時よりも学習結果が向上することを示した。, Learning the AI of a multiplayer imperfect information game without prior knowledge is one of the important challenges toward the application of AI to real-world problems. In this study, we attempted to learn action-value functions for trick-taking games, which is a kind of multiplayer imperfect information games. We built linear action-value functions using Q-learning. Experimental results show that the player built by Q-learning is superior to a simple rule-based player and that learning with self-play is better than using a random player as the opponent.}, pages = {196--200}, publisher = {情報処理学会}, title = {線形関数近似によるトリックテイキングゲームのQ学習}, volume = {2016}, year = {2016} }