<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-07T09:58:40Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00234849">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00234849</identifier>
        <datestamp>2025-01-19T09:41:34Z</datestamp>
        <setSpec>1164:5352:11553:11625</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>事前方策学習による低次元行動空間抽出と実環境における物体操り動作獲得</dc:title>
          <dc:title>Low-dimensional action space extraction through prior policy learning and acquisition of object manipulation policies in real environments</dc:title>
          <dc:creator>古巻, 鉄平</dc:creator>
          <dc:creator>八木, 聡明</dc:creator>
          <dc:creator>山森, 聡</dc:creator>
          <dc:creator>森本, 淳</dc:creator>
          <dc:creator>Teppei, Komaki</dc:creator>
          <dc:creator>Satoshi, Yagi</dc:creator>
          <dc:creator>Satoshi, Yamamori</dc:creator>
          <dc:creator>Jun, Morimoto</dc:creator>
          <dc:subject>情報論的学習理論と機械学習3</dc:subject>
          <dc:description>本研究では，多指ハンドロボットが持つ多くの関節自由度を活用し多様な形状を持つ物体を操る方策を獲得するための方法を提案する．特に，複数の物体を操るための共通の潜在行動空間を抽出し，効率的に実環境においての対象物の操作を可能とするための枠組みを検討した．具体的には，シミュレータを用いた仮想環境内において，異なる形状のバルブを操作するための異なる方策を多指ハンドロボットが学習し，それら複数の方策から生成される行動軌道群から変分自己符号化器を用いて共通の潜在行動空間を抽出，この潜在行動空間上で探索することにより，実環境におけるバルブ操作のための方策を少ないサンプル数で獲得できることを実験的に示した．</dc:description>
          <dc:description>In this study, we propose a policy acquisition method for manipulating objects of diﬀerent shapes by exploiting the degrees of freedom of a multi-ﬁngered hand robot. In particular, a framework for extracting a common latent action space for manipulating multiple objects and for eﬃciently manipulating objects in a real-world environment was explored. Speciﬁcally, a multi-ﬁnger hand robot learns diﬀerent strategies for manipulating valves of diﬀerent shapes in a simulated environment, extracts a common latent action space from a set of action trajectories generated by these polities using a Variational Autoencoder (VAE), and searches in this latent action space. We have shown experimentally that a multi-ﬁngered hand robot can acquire policies for valve operation in a real environment with a small number of trials.</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2024-06-13</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告バイオ情報学（BIO）</dc:identifier>
          <dc:identifier>22</dc:identifier>
          <dc:identifier>2024-BIO-78</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>5</dc:identifier>
          <dc:identifier>2188-8590</dc:identifier>
          <dc:identifier>AA12055912</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/234849/files/IPSJ-BIO24078022.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
