WEKO3
アイテム
NVIDIA H100 PCIeおよびAMD MI210における<i>N</i>体計算コードの性能評価
https://ipsj.ixsq.nii.ac.jp/records/227139
https://ipsj.ixsq.nii.ac.jp/records/22713981b1195b-4c46-4c3d-be6e-a6358abaa7e3
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-07-27 | |||||||||
| タイトル | ||||||||||
| タイトル | NVIDIA H100 PCIeおよびAMD MI210における<i>N</i>体計算コードの性能評価 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | アクセラレータ | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 東京大学情報基盤センター | ||||||||||
| 著者所属 | ||||||||||
| 東京大学情報基盤センター | ||||||||||
| 著者名 |
三木, 洋平
× 三木, 洋平
× 塙, 敏博
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | GPU は CPU に比べて高い電力性能を実現できるため,GPU を搭載したスーパーコンピュータの導入事例が増えてきている.新しい世代の GPU が発表される度に演算性能・電力性能の向上および新機能の追加がなされており,実アプリケーションを用いての継続的かつ詳細な性能評価が重要である.本研究では NVIDIA H100 PCIe および AMD MI210 向けに直接法に基づく N 体計算コードを実装・最適化し,性能評価を行った.NVIDIA H100 PCIe 上での単位時間あたりの相互作用計算数は,NVIDIA A100 の 2.04 倍にあたる 1.37×1012s-1 であった.得られた性能向上率は両 GPU の単精度浮動小数点演算の理論ピーク性能比 2.63 よりも小さいが,Streaming Multiprocessor の構成変更が最大の要因であり,N 体計算においては理論ピーク比相当の高速化は実現不可能である.AMD MI210 においては,CDNA 2 において新たに導入された packed FP32 命令を用いた高速化によって,AMD MI100 の 1.42 倍にあたる 9.49×1011s-1 が得られた.Packed FP32 命令の利用による性能向上は 1.33 倍であり,サイクル数ベースの見積もりから期待される 5/3 倍には及ばず,供給電力不足による動作周波数低下だけでは説明できない.各 GPU の消費電力あたりの性能値は,NVIDIA H100 PCIe が NVIDIA A100 の 1.56 倍の 4.11×109W-1,AMD MI210 は AMD 100 の 1.47 倍の 3.46×109W-1 であった. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10463942 | |||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2023-HPC-190, 号 28, p. 1-13, 発行日 2023-07-27 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8841 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||