WEKO3
アイテム
AMD MI100に向けた<i>N</i>体計算コードの移植と性能評価
https://ipsj.ixsq.nii.ac.jp/records/214207
https://ipsj.ixsq.nii.ac.jp/records/214207ceee1a52-024a-4d31-b2b0-1a355d50be87
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-11-29 | |||||||||
タイトル | ||||||||||
タイトル | AMD MI100に向けた<i>N</i>体計算コードの移植と性能評価 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | アクセラレータ | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東京大学情報基盤センター | ||||||||||
著者所属 | ||||||||||
東京大学情報基盤センター | ||||||||||
著者名 |
三木, 洋平
× 三木, 洋平
× 塙, 敏博
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 国内・海外を問わず今まで導入・運用されてきた GPU スパコンはそのほとんどが NVIDIA 製 GPU を搭載してきたが,今後は AMD 製 GPU や Intel 製 GPU を搭載した GPU スパコンの普及も予想される.したがって将来導入される GPU スパコンが NVIDIA 製 GPU,AMD 製 GPU,Intel 製 GPU のいずれを搭載したとしても対応できるようなソフトウェア開発・最適化を進めていかなければならない.本研究では NVIDIA 製 GPU 向けに CUDA で実装された既存の N 体計算コードを,AMD 製 GPU 上でも動作可能となるように ROCm/HIP に移植した上で性能評価を行った.AMD 製 GPU である MI100 向けの性能最適化としては逆数平方根の計算に__frsqrt_rn() 命令を用いることが重要であり,相互作用あたりの浮動小数点演算数として単精度 22 Flops を仮定すると,最大 14.6 TFlop/s という高い演算性能を発揮した.NVIDIA 製 GPU である A100 上では最大 14.5 TFlop/s であり,両 GPU の発揮した性能はほぼ同じであった.また A100 上で CUDA 版コードと HIP 版コードの性能差を測定したところ,性能差は存在しない,つまり HIP 実装によるオーバーヘッドは存在しないか十分に小さいということが分かった. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10463942 | |||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2021-HPC-182, 号 2, p. 1-10, 発行日 2021-11-29 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8841 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |