| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-01-18 |
| タイトル |
|
|
タイトル |
深層強化学習における状態遷移を考慮した内発的動機付けによる探索の効率化 |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
中部大学 |
| 著者所属 |
|
|
|
中部大学 |
| 著者所属 |
|
|
|
中部大学 |
| 著者所属 |
|
|
|
中部大学 |
| 著者所属 |
|
|
|
中部大学 |
| 著者名 |
大鹿, 海都
板谷, 英典
平川, 翼
山下, 隆義
藤吉, 弘亘
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
深層強化学習ではエージェントと環境間の相互作用により学習データを収集するため,環境の効率的な探索は網羅的な学習データの獲得に繋がる.この課題を解決する手法として,エージェントの内発的動機付けによる探索の効率化が提案されている.観測情報の新規性を評価し未知の状態空間への探索を促すことで効率的な探索を実現する.しかし,従来の内発的動機付けは現状態のみに着目しているため,環境の時系列情報を考慮していない.そこで,環境の状態遷移に着目した内発的動機付けを提案する.Atari2600 を用いた評価実験により,エージェント性能を解析することで状態遷移を考慮する有効性を示す. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
| 書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2024-CVIM-236,
号 13,
p. 1-6,
発行日 2024-01-18
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |