@techreport{oai:ipsj.ixsq.nii.ac.jp:00214207, author = {三木, 洋平 and 塙, 敏博}, issue = {2}, month = {Nov}, note = {国内・海外を問わず今まで導入・運用されてきた GPU スパコンはそのほとんどが NVIDIA 製 GPU を搭載してきたが,今後は AMD 製 GPU や Intel 製 GPU を搭載した GPU スパコンの普及も予想される.したがって将来導入される GPU スパコンが NVIDIA 製 GPU,AMD 製 GPU,Intel 製 GPU のいずれを搭載したとしても対応できるようなソフトウェア開発・最適化を進めていかなければならない.本研究では NVIDIA 製 GPU 向けに CUDA で実装された既存の N 体計算コードを,AMD 製 GPU 上でも動作可能となるように ROCm/HIP に移植した上で性能評価を行った.AMD 製 GPU である MI100 向けの性能最適化としては逆数平方根の計算に__frsqrt_rn() 命令を用いることが重要であり,相互作用あたりの浮動小数点演算数として単精度 22 Flops を仮定すると,最大 14.6 TFlop/s という高い演算性能を発揮した.NVIDIA 製 GPU である A100 上では最大 14.5 TFlop/s であり,両 GPU の発揮した性能はほぼ同じであった.また A100 上で CUDA 版コードと HIP 版コードの性能差を測定したところ,性能差は存在しない,つまり HIP 実装によるオーバーヘッドは存在しないか十分に小さいということが分かった.}, title = {AMD MI100に向けたN体計算コードの移植と性能評価}, year = {2021} }