@techreport{oai:ipsj.ixsq.nii.ac.jp:00234909, author = {古巻, 鉄平 and 八木, 聡明 and 山森, 聡 and 森本, 淳 and Teppei, Komaki and Satoshi, Yagi and Satoshi, Yamamori and Jun, Morimoto}, issue = {22}, month = {Jun}, note = {本研究では,多指ハンドロボットが持つ多くの関節自由度を活用し多様な形状を持つ物体を操る方策を獲得するための方法を提案する.特に,複数の物体を操るための共通の潜在行動空間を抽出し,効率的に実環境においての対象物の操作を可能とするための枠組みを検討した.具体的には,シミュレータを用いた仮想環境内において,異なる形状のバルブを操作するための異なる方策を多指ハンドロボットが学習し,それら複数の方策から生成される行動軌道群から変分自己符号化器を用いて共通の潜在行動空間を抽出,この潜在行動空間上で探索することにより,実環境におけるバルブ操作のための方策を少ないサンプル数で獲得できることを実験的に示した., In this study, we propose a policy acquisition method for manipulating objects of different shapes by exploiting the degrees of freedom of a multi-fingered hand robot. In particular, a framework for extracting a common latent action space for manipulating multiple objects and for efficiently manipulating objects in a real-world environment was explored. Specifically, a multi-finger hand robot learns different strategies for manipulating valves of different shapes in a simulated environment, extracts a common latent action space from a set of action trajectories generated by these polities using a Variational Autoencoder (VAE), and searches in this latent action space. We have shown experimentally that a multi-fingered hand robot can acquire policies for valve operation in a real environment with a small number of trials.}, title = {事前方策学習による低次元行動空間抽出と実環境における物体操り動作獲得}, year = {2024} }