階層型強化学習におけるサブゴール設定についての考察

大河内, 幸太郎; 清, 雄一; 田原, 康之; 大須賀, 昭彦

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

階層型強化学習におけるサブゴール設定についての考察

https://ipsj.ixsq.nii.ac.jp/records/203054

名前 / ファイル	ライセンス	アクション
IPSJ-ICS20197012.pdf (871.4 kB)	Copyright (c) 2020 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2020-02-10

タイトル

階層型強化学習におけるサブゴール設定についての考察

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

現在，電気通信大学

著者所属

現在，電気通信大学

著者所属

現在，電気通信大学

著者所属

現在，電気通信大学

著者所属(英)

Presently with The University of Electro-Communications

著者所属(英)

Presently with The University of Electro-Communications

著者所属(英)

Presently with The University of Electro-Communications

著者所属(英)

Presently with The University of Electro-Communications

著者名

大河内, 幸太郎
清, 雄一
田原, 康之
大須賀, 昭彦

論文抄録

内容記述タイプ

Other

内容記述

近年，囲碁や将棋などのゲームや e-sports に至るまで様々な分野において強化学習の研究が行われており，人間を上回るスコアを出すものも少なくない．しかし，強化学習の課題として，エージェントが報酬を環境から得る機会が少ないような環境においては，行動価値関数の学習が進まないためにエージェントの行動の最適化が進まないという問題が存在する．この問題の解決策のひとつとして階層型強化学習が挙げられるが，階層型強化学習においてタスクを複数のサブゴールに分割する際，サブゴールの設定をどのように行うかという課題が生じてしまう．本研究では，MountainCar-v0 を改変した環境においてサブゴールの概念を導入し，サブゴールが学習に与える影響，及びサブゴールのパラメータによる学習能力の差異についての検証と考察を行った．サブゴールの設定を変えた複数の環境で実験を行った結果，サブゴール設定は学習能力全体に多大な影響を与え，適切なサブゴール設定は効率的な階層型強化学習に不可欠であることが示された．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AA11135936

書誌情報

研究報告知能システム（ICS）

巻 2020-ICS-197, 号 12, p. 1-5, 発行日 2020-02-10

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-885X

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 20:40:58.064353

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

階層型強化学習におけるサブゴール設定についての考察

× 大河内, 幸太郎

× 清, 雄一

× 田原, 康之

× 大須賀, 昭彦

Versions

Share

Cite as

エクスポート