| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-06-13 |
| タイトル |
|
|
タイトル |
世界モデル学習とそれを用いたモデル予測制御の実時間・実環境応用に向けた検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
World Model Learning and Model Predictive Control Towards Realtime and Real World Robot Control |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
情報論的学習理論と機械学習3 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
ATR脳情報研究所 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科京都大学大学院情報学研究科 / ATR脳情報研究所 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
ATR Computational Neuroscience Labs |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University / ATR Computational Neuroscience Labs |
| 著者名 |
竹中, 郁弥
山森, 聡
森田, 光紀
八木, 聡明
森本, 淳
|
| 著者名(英) |
Fumiya, Takenaka
Satoshi, Yamamori
Mitsuki, Morita
Satoshi, Yagi
Jun, Morimoto
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,ヒューマノイドロボットをはじめとする多自由度ロボットの開発が注目を集めている.その動的な動作生成のため,すべての自由度を考慮した上でモデル予測制御を用いるアプローチが検討されているが,制御器の導出に必要となる計算時間や実環境とのモデル誤差のためにその実システムへの適用は容易ではない.そこで本研究では,強化学習分野で研究が進められてきたタスクに特化した世界モデルの学習および環境乱択化の手法をモデル予測制御に適用することにより,実環境において実時間での動作生成を可能とする枠組みの開発に向けた方法を検討した.具体的には,二脚倒立振子ロボットを対象に,動的なバランス制御をタスクとして検討したアプローチの評価をおこなった.その結果,世界モデルを用いることで計算時間が削減され,環境乱択化を行うことでモデル誤差に頑健な方策が得られることが確認された. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, the development of high-DoF robots, such as humanoid robots, has attracted much attention. In order to generate their dynamic behavior, approaches utilising model predictive control, which takes into account all degrees of freedom, have been considered. However, the application of these techniques to real systems is not straightforward due to the significant computational time required to derive controllers and model errors. In this study, we explore a method to develop a framework that enables real-time movement generation in real environments. Concretely, we propose to combine task-specific world model learning and domain randomization for model predictive control. We evaluated the proposed approach on a bipedal inverted pendulum robot, where dynamic balance control was considered as a target task. The results demonstrated that the utilization of a world model resulted in a reduction in computational time and that the acquired strategy was robust against modeling errors due to the domain randomization. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10505667 |
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS)
巻 2024-MPS-148,
号 23,
p. 1-4,
発行日 2024-06-13
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8833 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |