| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-06-13 |
| タイトル |
|
|
タイトル |
事前方策学習による低次元行動空間抽出と実環境における物体操り動作獲得 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Low-dimensional action space extraction through prior policy learning and acquisition of object manipulation policies in real environments |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
情報論的学習理論と機械学習3 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
ATR脳情報研究所 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 / ATR脳情報研究所 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
ATR Computational Neuroscience Labs |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University / ATR Computational Neuroscience Labs |
| 著者名 |
古巻, 鉄平
八木, 聡明
山森, 聡
森本, 淳
|
| 著者名(英) |
Teppei, Komaki
Satoshi, Yagi
Satoshi, Yamamori
Jun, Morimoto
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,多指ハンドロボットが持つ多くの関節自由度を活用し多様な形状を持つ物体を操る方策を獲得するための方法を提案する.特に,複数の物体を操るための共通の潜在行動空間を抽出し,効率的に実環境においての対象物の操作を可能とするための枠組みを検討した.具体的には,シミュレータを用いた仮想環境内において,異なる形状のバルブを操作するための異なる方策を多指ハンドロボットが学習し,それら複数の方策から生成される行動軌道群から変分自己符号化器を用いて共通の潜在行動空間を抽出,この潜在行動空間上で探索することにより,実環境におけるバルブ操作のための方策を少ないサンプル数で獲得できることを実験的に示した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this study, we propose a policy acquisition method for manipulating objects of different shapes by exploiting the degrees of freedom of a multi-fingered hand robot. In particular, a framework for extracting a common latent action space for manipulating multiple objects and for efficiently manipulating objects in a real-world environment was explored. Specifically, a multi-finger hand robot learns different strategies for manipulating valves of different shapes in a simulated environment, extracts a common latent action space from a set of action trajectories generated by these polities using a Variational Autoencoder (VAE), and searches in this latent action space. We have shown experimentally that a multi-fingered hand robot can acquire policies for valve operation in a real environment with a small number of trials. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
| 書誌情報 |
研究報告バイオ情報学(BIO)
巻 2024-BIO-78,
号 22,
p. 1-5,
発行日 2024-06-13
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |