@techreport{oai:ipsj.ixsq.nii.ac.jp:00225153, author = {桑村, 佳佑 and 大島, 聡史 and 片桐, 孝洋 and 永井, 亨 and 星野, 哲也}, issue = {9}, month = {Mar}, note = {機械学習手法の一つである強化学習を実空間やビデオゲームなどに用いる研究が注目を集めている.本稿では強化学習アルゴリズムの評価のためのシミュレーション環境の一つである Slime Volleyball Gym Environment を対象に,強化学習アルゴリズム PPO によって学習を行い,得られたモデルの性能評価について報告する.実験環境として名古屋大学情報基盤センターに設置されたスーパーコンピュータ「不老」を使用し,モデルの性能と学習時間及び並列数の関係について評価を行った.加えてシミュレーション環境 Breakout を対象にハイパーパラメータチューニングを行った.チューニングには Python における分散並列フレームワーク「Ray」を用いた.本研究では「Ray」による複数ノード実行を「不老」において初めて可能とした.チューニングにより得られたハイパーパラメータを用いたモデルの性能評価についても報告する.}, title = {大規模並列環境におけるビデオゲームの強化学習}, year = {2023} }