2024-03-29T06:49:39Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001098492023-11-17T02:17:36Z06504:06739:07816
複数の報酬とゲート機構を用いたモジュール型強化学習アルゴリズムjpn人工知能と認知科学http://id.nii.ac.jp/1001/00109825/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=109849&item_no=1&attribute_id=1&file_no=1Copyright (c) 2012 by the Information Processing Society of Japan早大早大早大吉田裕昭中村真吾橋本周司強化学習を用いて入力数が多く複雑なシステムの最適な制御器を獲得しようとすると、状態空間が指数関数的に拡大し、膨大な学習時間が必要となってしまう。この問題の解決策として、複数の単純な制御器を用意し、系の制御方法を学習するモジュール型強化学習が提案されている。しかし、いずれかの制御器を選択するだけの従来手法では、制御モジュールの組み合わせが生じるような状況に対応することができない。そこで、本研究では複数の制御器とゲート機構を用意し、制御機構ごとに報酬を与えることで、状態空間の爆発を抑えつつ複雑な系の制御器を獲得する強化学習アルゴリズムを提案する。実験では、テレビゲームのキャラクタ操作制御に提案手法を適用し、その有用性を確認した。AN00349328第74回全国大会講演論文集201212932942012-03-062014-12-18