@techreport{oai:ipsj.ixsq.nii.ac.jp:00217521, author = {桑村, 佳佑 and 大島, 聡史 and 片桐, 孝洋 and 永井, 亨}, issue = {18}, month = {Mar}, note = {機械学習手法の一つである強化学習を実空間やビデオゲームなどに用いる研究が注目を集めている.強化学習ではエージェントがいかに効率的に経験サンプルを集められるかが重要となる.本稿では強化学習アルゴリズムの評価のためのシミュレーション環境の一つである Slime Volleyball Gym Environment を強化学習アルゴリズム PPO によって学習し,得られたモデルの性能評価を行った.実験環境として名古屋大学情報基盤センターに設置されたスーパーコンピュータ「不老」を使用し,モデルの性能と学習時間の関係についても評価を行った.}, title = {スパコンにおけるPPOの性能評価}, year = {2022} }