@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00122312,
 book = {全国大会講演論文集},
 issue = {人工知能及び認知科学},
 month = {Sep},
 note = {本研究では,複数の障害物を含む作業空間における冗長マニピュレータのパスプランニングのための戦略を獲得することを目的とする確率的学習オートマトンは,その内部状態に応じて,出力集合の中から確率的に出力を選択する.その出力に対して評価者である環境からの反応に基づき,各出力確率を更新することによって,試行錯誤的に学習を行なう(再強化学習).その結果として,与えられた環境に適応することが知られている.冗長マニピュレータのパスプランニング問題に対しては,手先位置がその目標位置に近づいているかどうか,近くに障害物があるかどうかに基づいて環境からの反応を決定することによって,障害物を回避しながら初期状態から目標点に到達するパスを学習(適応)することが期待される.このとき,マニピュレータの状態を学習オートマトンの内部状態とすることによって,各内部状態のときにどの出力を選択すれば良いかの戦略を獲得することが可能になる.ここでは,マニピュレータの各関節に学習オートマトンを付加し,各学習オートマトンが独立に学習することによってパスプランニングのための戦略を獲得する手法を提案する.具体的には,学習オートマトンの内部状態を各関節の角度と角速度に基づいて決定し,出力を各関節の出力トルクとし,手先位置と目標位置との距離の変化と周囲の障害物の状態によって環境からの反応を決定する. 最後に計算機実験によりその動作を確認する.},
 pages = {61--62},
 publisher = {情報処理学会},
 title = {学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得},
 volume = {第45回},
 year = {1992}
}