WEKO3
アイテム
複素強化学習を用いた学習分類子システムによるPoMDPs環境への展開
https://ipsj.ixsq.nii.ac.jp/records/95245
https://ipsj.ixsq.nii.ac.jp/records/952454105dac3-d81e-44b1-b9c4-4e68bff1515b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-09-19 | |||||||
タイトル | ||||||||
タイトル | 複素強化学習を用いた学習分類子システムによるPoMDPs環境への展開 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電気通信大学大学院情報理工学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報理工学研究科/日本学術振興会特別研究員(DC1) | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報理工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics and Engineering, The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics and Engineering, The University of Electro-Communications / Research Fellow of Japan Society for the Promotion of Science(DC1) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics and Engineering, The University of Electro-Communications | ||||||||
著者名 |
山﨑大地
× 山﨑大地
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,難解な部分マルコフ決定過程 (PoMDPs) 環境において最適な方策を獲得するために,複素強化学習 (Complex-Valued Reinforcement Learning : CVRL) を用いた学習分類子システム (CVRL-based Classifier System: CVRL-CS) を提案する.計算機実験では,従来手法 (Q-Learning と ZCSM) が適用困難な PoMDPs 環境として,a) 状態空間が大きい環境,b) 不完全知覚の特性が異なる環境に提案手法を適用したところ,1) 提案手法は,従来手法よりも少ない学習回数で高い学習性能を実現し,2) 従来手法が学習不可能であるのに対し,初期状態が不完全知覚となる問題においても,提案手法は最適な方策を獲得可能であることを示した. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2013-MPS-95, 号 12, p. 1-6, 発行日 2013-09-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |