学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得

https://ipsj.ixsq.nii.ac.jp/records/122312

名前 / ファイル	ライセンス	アクション
KJ00001344014.pdf (198.5 kB)

Item type		National Convention(1)
公開日		1992-09-28
タイトル
	タイトル	学習オートマトンによる冗長マニピュレータのパスプランニングの戦略獲得
タイトル
	言語	en
	タイトル	Strategy Acquisition of Redundant Manipulator Path Planning by Learning Automata
言語
	言語	jpn
資源タイプ
	資源タイプ識別子	http://purl.org/coar/resource_type/c_5794
	資源タイプ	conference paper
著者所属
		北海道大学
著者所属
		北海道大学
著者所属(英)
		en
		Hokkaido Univ.
著者所属(英)
		en
		Hokkaido Univ.
論文抄録
	内容記述タイプ	Other
	内容記述	本研究では,複数の障害物を含む作業空間における冗長マニピュレータのパスプランニングのための戦略を獲得することを目的とする確率的学習オートマトンは,その内部状態に応じて,出力集合の中から確率的に出力を選択する.その出力に対して評価者である環境からの反応に基づき,各出力確率を更新することによって,試行錯誤的に学習を行なう(再強化学習).その結果として,与えられた環境に適応することが知られている.冗長マニピュレータのパスプランニング問題に対しては,手先位置がその目標位置に近づいているかどうか,近くに障害物があるかどうかに基づいて環境からの反応を決定することによって,障害物を回避しながら初期状態から目標点に到達するパスを学習(適応)することが期待される.このとき,マニピュレータの状態を学習オートマトンの内部状態とすることによって,各内部状態のときにどの出力を選択すれば良いかの戦略を獲得することが可能になる.ここでは,マニピュレータの各関節に学習オートマトンを付加し,各学習オートマトンが独立に学習することによってパスプランニングのための戦略を獲得する手法を提案する.具体的には,学習オートマトンの内部状態を各関節の角度と角速度に基づいて決定し,出力を各関節の出力トルクとし,手先位置と目標位置との距離の変化と周囲の障害物の状態によって環境からの反応を決定する. 最後に計算機実験によりその動作を確認する.
書誌レコードID
	収録物識別子タイプ	NCID
	収録物識別子	AN00349328
書誌情報		全国大会講演論文集巻第45回, 号人工知能及び認知科学, p. 61-62, 発行日 1992-09-28
出版者
	言語	ja
	出版者	情報処理学会