ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. コンピュータビジョンとイメージメディア(CVIM)
  3. 2024
  4. 2024-CVIM-236

深層強化学習における状態遷移を考慮した内発的動機付けによる探索の効率化

https://ipsj.ixsq.nii.ac.jp/records/231935
https://ipsj.ixsq.nii.ac.jp/records/231935
57bdd274-89a9-4232-bde6-a189fdabde7b
名前 / ファイル ライセンス アクション
IPSJ-CVIM24236013.pdf IPSJ-CVIM24236013.pdf (2.1 MB)
Copyright (c) 2024 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
CVIM:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-01-18
タイトル
タイトル 深層強化学習における状態遷移を考慮した内発的動機付けによる探索の効率化
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
中部大学
著者所属
中部大学
著者所属
中部大学
著者所属
中部大学
著者所属
中部大学
著者名 大鹿, 海都

× 大鹿, 海都

大鹿, 海都

Search repository
板谷, 英典

× 板谷, 英典

板谷, 英典

Search repository
平川, 翼

× 平川, 翼

平川, 翼

Search repository
山下, 隆義

× 山下, 隆義

山下, 隆義

Search repository
藤吉, 弘亘

× 藤吉, 弘亘

藤吉, 弘亘

Search repository
論文抄録
内容記述タイプ Other
内容記述 深層強化学習ではエージェントと環境間の相互作用により学習データを収集するため,環境の効率的な探索は網羅的な学習データの獲得に繋がる.この課題を解決する手法として,エージェントの内発的動機付けによる探索の効率化が提案されている.観測情報の新規性を評価し未知の状態空間への探索を促すことで効率的な探索を実現する.しかし,従来の内発的動機付けは現状態のみに着目しているため,環境の時系列情報を考慮していない.そこで,環境の状態遷移に着目した内発的動機付けを提案する.Atari2600 を用いた評価実験により,エージェント性能を解析することで状態遷移を考慮する有効性を示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11131797
書誌情報 研究報告コンピュータビジョンとイメージメディア(CVIM)

巻 2024-CVIM-236, 号 13, p. 1-6, 発行日 2024-01-18
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8701
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:35:43.885527
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3