ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 全国大会
  2. 86回
  3. 人工知能と認知科学

オフラインデータを利用した意味的探索による世界モデルのサンプル効率の改善

https://ipsj.ixsq.nii.ac.jp/records/236006
https://ipsj.ixsq.nii.ac.jp/records/236006
54af1f1f-db5b-4678-be37-fdc048d9d971
名前 / ファイル ライセンス アクション
IPSJ-Z86-6Q-03.pdf IPSJ-Z86-6Q-03.pdf (318.4 kB)
Copyright (c) 2024 by the Information Processing Society of Japan
Item type National Convention(1)
公開日 2024-03-01
タイトル
タイトル オフラインデータを利用した意味的探索による世界モデルのサンプル効率の改善
言語
言語 jpn
キーワード
主題Scheme Other
主題 人工知能と認知科学
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
早大
著者所属
早大
著者所属
早大
著者名 立松, 健輔

× 立松, 健輔

立松, 健輔

Search repository
綱島, 秀樹

× 綱島, 秀樹

綱島, 秀樹

Search repository
森島, 繁生

× 森島, 繁生

森島, 繁生

Search repository
論文抄録
内容記述タイプ Other
内容記述 深層強化学習手法は多くの困難な環境で成功を収めている.一方で,高い性能を発揮するには環境との膨大な相互作用を必要とするという問題が存在する.そこで本研究では,モデルベース強化学習の1つである世界モデルにおいて,人間が事前に用意したオフラインデータを利用し,エージェントによる環境の探索を改善する新たな学習法を提案する.オフラインデータから模倣学習した方策を用いて環境の探索を行うことで,環境とのインタラクションを少なくモデル化するための経験を獲得する.また,模倣学習で獲得した方策において主成分分析を行い,いくつかの主成分にノイズを付加することによって意味のある探索につながるかを調査した.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00349328
書誌情報 第86回全国大会講演論文集

巻 2024, 号 1, p. 325-326, 発行日 2024-03-01
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:25:56.032952
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3