WEKO3
アイテム
マルチロボット巡回清掃における強化学習を用いた行動計画法の提案と評価
https://ipsj.ixsq.nii.ac.jp/records/90437
https://ipsj.ixsq.nii.ac.jp/records/90437b6eae97f-0403-4857-87c8-d444e7aea253
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2013-02-20 | |||||||
| タイトル | ||||||||
| タイトル | マルチロボット巡回清掃における強化学習を用いた行動計画法の提案と評価 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 早稲田大学基幹理工学研究科情報理工学専攻 | ||||||||
| 著者所属 | ||||||||
| 早稲田大学基幹理工学研究科情報理工学専攻 | ||||||||
| 著者所属 | ||||||||
| 早稲田大学基幹理工学研究科情報理工学専攻 | ||||||||
| 著者名 |
米田圭佑
加藤千紘
菅原俊治
× 米田圭佑 加藤千紘 菅原俊治
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本研究では,複数のロボットによる継続的な巡回清掃で環境中に存在するごみの量を最小化することを目的に,強化学習を用いた行動計画手法を提案する.ロボットが広い領域を継続的に清掃するには,移動能力やバッテリによるロボットの活動時間などの物理的な制約から,複数ロボットの協力が必要である.また環境にもごみの溜まりやすさの差があり,単純な巡回では十分とは言えない.そこで,継続的なマルチロボット巡回清掃問題をマルチエージェントモデルの枠組みで定式化し,ごみの存在時間の総和という評価指標を定義する.その上で,この指標を小さくするように,強化学習によりエージェントが自律的に適切な行動計画戦略を決定する手法を提案する.評価実験からごみの発生に偏りがある環境では,提案手法と学習を行わない単一手法と比較して効果的にごみを回収できることが分かった.また提案手法では環境に応じてエージェントに行動計画戦略をもたせることができた. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10505667 | |||||||
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2013-MPS-92, 号 18, p. 1-6, 発行日 2013-02-20 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||