WEKO3
アイテム
依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装
https://ipsj.ixsq.nii.ac.jp/records/236007
https://ipsj.ixsq.nii.ac.jp/records/236007f596038b-5776-49cb-8c4f-db5938778c8b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||
| タイトル | ||||||||||
| タイトル | 依存関係を持つ複数のゴールを達成するための強化学習エージェントの実装 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 人工知能と認知科学 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
| 資源タイプ | conference paper | |||||||||
| 著者所属 | ||||||||||
| 京大 | ||||||||||
| 著者所属 | ||||||||||
| 京大 | ||||||||||
| 著者名 |
北河, 英己
× 北河, 英己
× 丁, 世堯
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 既存の強化学習タスクでは主に単一の目標を追求するものが多いが、実世界では依存関係を持つ複数の目標を同時に達成する必要があるシナリオが多く存在する。既存の強化学習手法でもこのような複雑なタスクへの適応は可能だが、単純なタスクと比較すると性能はよくない。本稿では、マインクラフト風強化学習環境「crafter」を用いて、複数の強化学習手法の性能を比較し評価する。「crafter」は、依存関係を持つ複数のゴールを同時に達成する必要がある複雑なタスクを提供するため、本研究に適している。この研究により、依存関係のある複数の目標を含む複雑なタスクに対する強化学習アプローチの可能性と限界を明らかにする。 | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN00349328 | |||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 327-328, 発行日 2024-03-01 |
|||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||