Item type |
SIG Technical Reports(1) |
公開日 |
2020-02-10 |
タイトル |
|
|
タイトル |
階層型強化学習におけるサブゴール設定についての考察 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
現在,電気通信大学 |
著者所属 |
|
|
|
現在,電気通信大学 |
著者所属 |
|
|
|
現在,電気通信大学 |
著者所属 |
|
|
|
現在,電気通信大学 |
著者所属(英) |
|
|
|
en |
|
|
Presently with The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Presently with The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Presently with The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Presently with The University of Electro-Communications |
著者名 |
大河内, 幸太郎
清, 雄一
田原, 康之
大須賀, 昭彦
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,囲碁や将棋などのゲームや e-sports に至るまで様々な分野において強化学習の研究が行われており,人間を上回るスコアを出すものも少なくない.しかし,強化学習の課題として,エージェントが報酬を環境から得る機会が少ないような環境においては,行動価値関数の学習が進まないためにエージェントの行動の最適化が進まないという問題が存在する.この問題の解決策のひとつとして階層型強化学習が挙げられるが,階層型強化学習においてタスクを複数のサブゴールに分割する際,サブゴールの設定をどのように行うかという課題が生じてしまう.本研究では,MountainCar-v0 を改変した環境においてサブゴールの概念を導入し,サブゴールが学習に与える影響,及びサブゴールのパラメータによる学習能力の差異についての検証と考察を行った.サブゴールの設定を変えた複数の環境で実験を行った結果,サブゴール設定は学習能力全体に多大な影響を与え,適切なサブゴール設定は効率的な階層型強化学習に不可欠であることが示された. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11135936 |
書誌情報 |
研究報告知能システム(ICS)
巻 2020-ICS-197,
号 12,
p. 1-5,
発行日 2020-02-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-885X |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |