@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00183861, author = {加納, 由希夫 and 鶴岡, 慶雅 and Yukio, Kano and Yoshimasa, Tsuruoka}, book = {ゲームプログラミングワークショップ2017論文集}, month = {Nov}, note = {AIが内部報酬を自動生成することによって,外部報酬を利用しない自律的な強化学習を実現することは,報酬設計が困難であるような現実世界の問題に人工知能を応用させる上で非常に重要な課題の一つである.内部報酬を自動で生成する手法の一つにICM(Pathak,2017) があり,A3C(Mnih,2016)の報酬にICMの内部報酬を用いた強化学習は,VizDoomやSuper Mario Bros などのゲームにおいて高い学習成果を示している.本研究では,ゲームの初期状態が毎回変化するという特徴を持つローグライクゲームに対して,ICMの手法を適用して効率的な強化学習を行えるようにすることを目指す., Realization of autonomous reinforcement learning that does not use external compensation by automatically generating internal compensation from AI is extremely important in applying artificial intelli-gence to real world problems where compensation design is difficult. ICM (Pathak, 2017) is one method to automatically generate internal compensation, reinforcement learning using internal compensation of ICM for remuneration of A3C (Mnih, 2016) is used in games such as VizDoom and Super Mario Bros. It shows high learning outcome. In this research, we aim to enable efficient reinforcement learning by applying ICM method to roguelike games, which features the initial state of the game changing every time.}, pages = {219--225}, publisher = {情報処理学会}, title = {内部報酬を自動生成する強化学習による一人用RPGの自動攻略}, volume = {2017}, year = {2017} }