@techreport{oai:ipsj.ixsq.nii.ac.jp:00225153,
 author = {桑村, 佳佑 and 大島, 聡史 and 片桐, 孝洋 and 永井, 亨 and 星野, 哲也},
 issue = {9},
 month = {Mar},
 note = {機械学習手法の一つである強化学習を実空間やビデオゲームなどに用いる研究が注目を集めている．本稿では強化学習アルゴリズムの評価のためのシミュレーション環境の一つである Slime Volleyball Gym Environment を対象に，強化学習アルゴリズム PPO によって学習を行い，得られたモデルの性能評価について報告する．実験環境として名古屋大学情報基盤センターに設置されたスーパーコンピュータ「不老」を使用し，モデルの性能と学習時間及び並列数の関係について評価を行った．加えてシミュレーション環境 Breakout を対象にハイパーパラメータチューニングを行った．チューニングには Python における分散並列フレームワーク「Ray」を用いた．本研究では「Ray」による複数ノード実行を「不老」において初めて可能とした．チューニングにより得られたハイパーパラメータを用いたモデルの性能評価についても報告する．},
 title = {大規模並列環境におけるビデオゲームの強化学習},
 year = {2023}
}