WEKO3
アイテム
学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得
https://ipsj.ixsq.nii.ac.jp/records/122312
https://ipsj.ixsq.nii.ac.jp/records/12231292242378-f240-4498-8637-5eb43880f683
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1992-09-28 | |||||
タイトル | ||||||
タイトル | 学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Strategy Acquisition of Redundant Manipulator Path Planning by Learning Automata | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
北海道大学 | ||||||
著者所属 | ||||||
北海道大学 | ||||||
著者所属(英) | ||||||
en | ||||||
Hokkaido Univ. | ||||||
著者所属(英) | ||||||
en | ||||||
Hokkaido Univ. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 本研究では,複数の障害物を含む作業空間における冗長マニピュレータのパスプランニングのための戦略を獲得することを目的とする確率的学習オートマトンは,その内部状態に応じて,出力集合の中から確率的に出力を選択する.その出力に対して評価者である環境からの反応に基づき,各出力確率を更新することによって,試行錯誤的に学習を行なう(再強化学習).その結果として,与えられた環境に適応することが知られている.冗長マニピュレータのパスプランニング問題に対しては,手先位置がその目標位置に近づいているかどうか,近くに障害物があるかどうかに基づいて環境からの反応を決定することによって,障害物を回避しながら初期状態から目標点に到達するパスを学習(適応)することが期待される.このとき,マニピュレータの状態を学習オートマトンの内部状態とすることによって,各内部状態のときにどの出力を選択すれば良いかの戦略を獲得することが可能になる.ここでは,マニピュレータの各関節に学習オートマトンを付加し,各学習オートマトンが独立に学習することによってパスプランニングのための戦略を獲得する手法を提案する.具体的には,学習オートマトンの内部状態を各関節の角度と角速度に基づいて決定し,出力を各関節の出力トルクとし,手先位置と目標位置との距離の変化と周囲の障害物の状態によって環境からの反応を決定する. 最後に計算機実験によりその動作を確認する. | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第45回, 号 人工知能及び認知科学, p. 61-62, 発行日 1992-09-28 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |