WEKO3
アイテム
遺伝的プログラミングと強化学習の統合に基づく実ロボットの行動獲得
https://ipsj.ixsq.nii.ac.jp/records/17238
https://ipsj.ixsq.nii.ac.jp/records/172386ef5eede-26b0-4bce-9d0f-f1e6a9a05417
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2004-02-15 | |||||||
| タイトル | ||||||||
| タイトル | 遺伝的プログラミングと強化学習の統合に基づく実ロボットの行動獲得 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Integration of Genetic Programming and Reinforcement Learning for Real Robots | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | GP | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 東京大学大学院新領域創成科学研究科 | ||||||||
| 著者所属 | ||||||||
| 東京大学大学院新領域創成科学研究科 | ||||||||
| 著者所属 | ||||||||
| 東京大学大学院新領域創成科学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Frontier Science, The University of Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Frontier Science, The University of Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Frontier Science, The University of Tokyo | ||||||||
| 著者名 |
神尾, 正太郎
三橋, 秀行
伊庭, 斉志
× 神尾, 正太郎 三橋, 秀行 伊庭, 斉志
|
|||||||
| 著者名(英) |
Shotaro, Kamio
Hideyuki, Mitsuhashi
Hitoshi, Iba
× Shotaro, Kamio Hideyuki, Mitsuhashi Hitoshi, Iba
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では,遺伝的プログラミングと強化学習を統合した,実ロボットでの実時間学習が可能な手法を提案する.提案手法では,高精度のシミュレータは必要としない.なぜなら学習はシミュレータ上だけではなく,実ロボット上でも行われるからである.このため実ロボットでの最適行動を得ることができる.本論文では提案手法に基づき実ロボットAIBOで行った実験結果を示し,提案手法が従来のQ学習手法よりも性能が良いことを示す. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | We propose an integrated technique of genetic programming (GP) and reinforcement learning (RL) that allows a real robot to execute real-time learning. Our technique does not need a precise simulator because learning is done with a real robot. Moreover, our technique makes it possible to learn optimal actions in real robots. We show the result of an experiment with a real robot AIBO and represents the result which proves proposed technique performs better than traditional Q-learning method. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11464803 | |||||||
| 書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM) 巻 45, 号 SIG02(TOM10), p. 134-143, 発行日 2004-02-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7780 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||