Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-09 |
タイトル |
|
|
タイトル |
大規模並列環境におけるビデオゲームの強化学習 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋大学大学院情報学研究科 |
著者所属 |
|
|
|
名古屋大学情報基盤センター/九州大学情報基盤研究開発センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University / Research Institute for Information Technology, Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者名 |
桑村, 佳佑
大島, 聡史
片桐, 孝洋
永井, 亨
星野, 哲也
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
機械学習手法の一つである強化学習を実空間やビデオゲームなどに用いる研究が注目を集めている.本稿では強化学習アルゴリズムの評価のためのシミュレーション環境の一つである Slime Volleyball Gym Environment を対象に,強化学習アルゴリズム PPO によって学習を行い,得られたモデルの性能評価について報告する.実験環境として名古屋大学情報基盤センターに設置されたスーパーコンピュータ「不老」を使用し,モデルの性能と学習時間及び並列数の関係について評価を行った.加えてシミュレーション環境 Breakout を対象にハイパーパラメータチューニングを行った.チューニングには Python における分散並列フレームワーク「Ray」を用いた.本研究では「Ray」による複数ノード実行を「不老」において初めて可能とした.チューニングにより得られたハイパーパラメータを用いたモデルの性能評価についても報告する. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2023-HPC-188,
号 9,
p. 1-17,
発行日 2023-03-09
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |