@techreport{oai:ipsj.ixsq.nii.ac.jp:00234850, author = {竹中, 郁弥 and 山森, 聡 and 森田, 光紀 and 八木, 聡明 and 森本, 淳 and Fumiya, Takenaka and Satoshi, Yamamori and Mitsuki, Morita and Satoshi, Yagi and Jun, Morimoto}, issue = {23}, month = {Jun}, note = {近年,ヒューマノイドロボットをはじめとする多自由度ロボットの開発が注目を集めている.その動的な動作生成のため,すべての自由度を考慮した上でモデル予測制御を用いるアプローチが検討されているが,制御器の導出に必要となる計算時間や実環境とのモデル誤差のためにその実システムへの適用は容易ではない.そこで本研究では,強化学習分野で研究が進められてきたタスクに特化した世界モデルの学習および環境乱択化の手法をモデル予測制御に適用することにより,実環境において実時間での動作生成を可能とする枠組みの開発に向けた方法を検討した.具体的には,二脚倒立振子ロボットを対象に,動的なバランス制御をタスクとして検討したアプローチの評価をおこなった.その結果,世界モデルを用いることで計算時間が削減され,環境乱択化を行うことでモデル誤差に頑健な方策が得られることが確認された., In recent years, the development of high-DoF robots, such as humanoid robots, has attracted much attention. In order to generate their dynamic behavior, approaches utilising model predictive control, which takes into account all degrees of freedom, have been considered. However, the application of these techniques to real systems is not straightforward due to the significant computational time required to derive controllers and model errors. In this study, we explore a method to develop a framework that enables real-time movement generation in real environments. Concretely, we propose to combine task-specific world model learning and domain randomization for model predictive control. We evaluated the proposed approach on a bipedal inverted pendulum robot, where dynamic balance control was considered as a target task. The results demonstrated that the utilization of a world model resulted in a reduction in computational time and that the acquired strategy was robust against modeling errors due to the domain randomization.}, title = {世界モデル学習とそれを用いたモデル予測制御の実時間・実環境応用に向けた検討}, year = {2024} }