Item type |
SIG Technical Reports(1) |
公開日 |
2022-03-11 |
タイトル |
|
|
タイトル |
スパコンにおけるPPOの性能評価 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
強化学習 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋大学大学院情報学研究科 |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者名 |
桑村, 佳佑
大島, 聡史
片桐, 孝洋
永井, 亨
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
機械学習手法の一つである強化学習を実空間やビデオゲームなどに用いる研究が注目を集めている.強化学習ではエージェントがいかに効率的に経験サンプルを集められるかが重要となる.本稿では強化学習アルゴリズムの評価のためのシミュレーション環境の一つである Slime Volleyball Gym Environment を強化学習アルゴリズム PPO によって学習し,得られたモデルの性能評価を行った.実験環境として名古屋大学情報基盤センターに設置されたスーパーコンピュータ「不老」を使用し,モデルの性能と学習時間の関係についても評価を行った. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11362144 |
書誌情報 |
研究報告ゲーム情報学(GI)
巻 2022-GI-47,
号 18,
p. 1-6,
発行日 2022-03-11
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8736 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |