WEKO3
アイテム
NetHackにおける深層強化学習アルゴリズムDQNとPPOの比較評価
https://ipsj.ixsq.nii.ac.jp/records/238517
https://ipsj.ixsq.nii.ac.jp/records/238517c493c26c-91c8-473b-9647-21b5ed23fe65
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年8月30日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, GI:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-08-30 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | NetHackにおける深層強化学習アルゴリズムDQNとPPOの比較評価 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | その他のゲーム | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 電気通信大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電気通信大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電気通信大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電気通信大学 | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| The University of Electro-Communications | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| The University of Electro-Communications | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| The University of Electro-Communications | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| The University of Electro-Communications | ||||||||||||||
| 著者名 |
大貫, 泰弘
× 大貫, 泰弘
× 田原, 康之
× 大須賀, 昭彦
× 清, 雄一
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 深層強化学習(DRL)は,様々なビデオゲームにおいてエージェントの研究に広く利用されており,その有用性が示されている.近年,ローグライクゲームのような複雑な環境での DRL エージェントの研究が注目されている.複雑な環境下における DRL の研究は,エージェントが高度な戦略を学習し適用する能力を評価する上で多くの利点がある.その中で,ローグライクゲームの一つである NetHack についても研究が行われている.本研究では,NetHack を用いた強化学習環境 NetHack Learning Environment において,DQN および PPO を用いた深層強化学習エージェントについて比較を行う.また,環境から与えられる報酬以外に追加の報酬を設定し,エージェントの学習に与える影響について調査する. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AA11362144 | |||||||||||||
| 書誌情報 |
研究報告ゲーム情報学(GI) 巻 2024-GI-53, 号 7, p. 1-8, 発行日 2024-08-30 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8736 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||