Item type |
Symposium(1) |
公開日 |
2017-05-29 |
タイトル |
|
|
タイトル |
スループットを用いた「京」におけるMPI通信性能の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of MPI communication performance using throughput on the K computer |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
理化学研究所 |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
FUJITSU,LTD. |
著者所属(英) |
|
|
|
en |
|
|
FUJITSU,LTD. |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者名 |
北澤, 好人
黒田, 明義
志田, 直之
安達, 知也
南, 一生
|
著者名(英) |
Yoshito, Kitazawa
Akiyoshi, Kuroda
Naoyuki, Shida
Tomoya, Adachi
Kazuo, Minami
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
スーパーコンピュータ 「京」 は 82,944 ノードから構成される超並列のシステムであり,アプリケーションにて高い実効性能を得るためには,MPI 通信関数の性能が重要である.本稿では,スーパーコンピュータ 「京」 における MPI 通信性能を測定し,実測したスループットのピーク性能と半性能長から,通信バンド幅とレイテンシを算出した.また通信モデルから通信時間の見積式を理論的に導出し,測定値と比較することで性能の評価を行った.その結果,隣接通信ではピーク性能と通信バンド幅がほぼ一致して,遅延時間は通信のレイテンシによる値と概ね合っていることがわかった.集団通信では Bcast,Allreduce,Allgather について同様の評価を行い,ピーク性能が約 10 ~ 20% 低く,遅延時間は約 10% ~ 50% の違いがあるものの,測定結果が通信時間見積式と同様の傾向であることがわかった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The K computer is a massively parallel system with 82,944 nodes, and the performance of the MPI communication function is extremely important to obtain high effective performance for the application. In this paper, we measured the MPI communication performance on the K computer and calculated the communication bandwidth and latency from the peak performance and the half-performance length of measured throughput. Furthermore, we derived the estimation formula of the communication time theoretically from the communication model, and evaluated the communication performance by comparing with the measured value. As a result, in nearest neighbor communication, the peak performance almost matched the communication bandwidth, and the delay time roughly matched the communication latency. In collective communication, we evaluated Bcast, Allreduce and Allgather similarly. The peak performance was about 10% - 20% lower and delay time was about 10% - 50% different, but measurement results were the same trend as estimation results. |
書誌情報 |
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集
巻 2017,
p. 17-25,
発行日 2017-05-29
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |