WEKO3
アイテム
複素強化学習を用いた学習分類子システムによるPoMDPs環境への展開
https://ipsj.ixsq.nii.ac.jp/records/95245
https://ipsj.ixsq.nii.ac.jp/records/952454105dac3-d81e-44b1-b9c4-4e68bff1515b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2013-09-19 | |||||||
| タイトル | ||||||||
| タイトル | 複素強化学習を用いた学習分類子システムによるPoMDPs環境への展開 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 電気通信大学大学院情報理工学研究科 | ||||||||
| 著者所属 | ||||||||
| 電気通信大学大学院情報理工学研究科/日本学術振興会特別研究員(DC1) | ||||||||
| 著者所属 | ||||||||
| 電気通信大学大学院情報理工学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics and Engineering, The University of Electro-Communications | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics and Engineering, The University of Electro-Communications / Research Fellow of Japan Society for the Promotion of Science(DC1) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics and Engineering, The University of Electro-Communications | ||||||||
| 著者名 |
山﨑大地
中田雅也
高玉圭樹
× 山﨑大地 中田雅也 高玉圭樹
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では,難解な部分マルコフ決定過程 (PoMDPs) 環境において最適な方策を獲得するために,複素強化学習 (Complex-Valued Reinforcement Learning : CVRL) を用いた学習分類子システム (CVRL-based Classifier System: CVRL-CS) を提案する.計算機実験では,従来手法 (Q-Learning と ZCSM) が適用困難な PoMDPs 環境として,a) 状態空間が大きい環境,b) 不完全知覚の特性が異なる環境に提案手法を適用したところ,1) 提案手法は,従来手法よりも少ない学習回数で高い学習性能を実現し,2) 従来手法が学習不可能であるのに対し,初期状態が不完全知覚となる問題においても,提案手法は最適な方策を獲得可能であることを示した. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10505667 | |||||||
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2013-MPS-95, 号 12, p. 1-6, 発行日 2013-09-19 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||