@techreport{oai:ipsj.ixsq.nii.ac.jp:00095245, author = {山﨑大地 and 中田雅也 and 高玉圭樹}, issue = {12}, month = {Sep}, note = {本論文では,難解な部分マルコフ決定過程 (PoMDPs) 環境において最適な方策を獲得するために,複素強化学習 (Complex-Valued Reinforcement Learning : CVRL) を用いた学習分類子システム (CVRL-based Classifier System: CVRL-CS) を提案する.計算機実験では,従来手法 (Q-Learning と ZCSM) が適用困難な PoMDPs 環境として,a) 状態空間が大きい環境,b) 不完全知覚の特性が異なる環境に提案手法を適用したところ,1) 提案手法は,従来手法よりも少ない学習回数で高い学習性能を実現し,2) 従来手法が学習不可能であるのに対し,初期状態が不完全知覚となる問題においても,提案手法は最適な方策を獲得可能であることを示した.}, title = {複素強化学習を用いた学習分類子システムによるPoMDPs環境への展開}, year = {2013} }