Item type |
SIG Technical Reports(1) |
公開日 |
2018-12-10 |
タイトル |
|
|
タイトル |
AI橋渡しクラウドABCIにおけるLinpack benchmarkの最適化と性能評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Performance evaluation and optimization of Linpack benchmark on ABCI |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
性能評価 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属 |
|
|
|
株式会社富士通研究所 |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Labratories Ltd. |
著者名 |
本田, 巧
笠置, 明彦
福本, 尚人
大辻, 弘貴
土肥, 義康
田原, 司睦
中島, 耕太
|
著者名(英) |
Takumi, Honda
Akihiko, Kasagi
Naoto, Fukumoto
Hiroki, Ohtsuji
Yoshiyasu, Doi
Tsuguchika, Tabaru
Kohta, Nakashima
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年の HPC システムは,HPC アプリケーションに加え,高い演算性能が必要なディープラーニングへの需要も増加している.そのため,高い演算性能と電力効率を有する GPU を搭載したノードで構成される PC クラスタが増加している.GPU の搭載でノードの演算性能が大幅に向上した一方で,ノード間通信に用いられる InfiniBand や CPU-GPU 間のデータ転送に用いられる PCIe は相対的に性能向上が緩やかであるため,システム全体の性能バランスの観点では,通信性能がボトルネックになりやすい.そのため,GPU クラスタにおける大規模実行では通信処理の最適化が重要になる.本論文では,最新 GPU クラスタ向けに開発した HPL と通信の最適化,また,大規模 GPU クラスタにおける Linpack ベンチマークの特性について報告する.本研究の性能評価は,4352 基の NVIDIA Tesla V100 を有する GPU クラスタ “AI 橋渡しクラウド (ABCI) ” で行った.最適化を行った HPL を用いて性能評価を行ったところ,全ノードの実行で 19.88 PFLOPS の性能を達成し,ABCI は 2018 年 6 月の Top 500 において世界 5 位の実行性能を達成した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The demand for improving computing power increases in not only HPC field but also DL field. Thus, recent PC clusters are equipped with GPUs which have high computing power and energy efficiency. In contrast, communication performance such as InfiniBand and PCIe has been improved slowly, compared with computing power, and the data communication easily becomes a bottleneck in a case of execution of applications on a large GPU clusters. In this paper, we report optimization techniques which are applied for improving Linpack performance and the performance evaluation on ABCI (AI Briding Cloud Infrastracture). ABCI is a petascale GPU cluster which has 4352 NVIDIA Tesla V100 and 2176 Intel Xeon Gold 6148. Our HPL achieved 19.88 PFLOPS, and the score made ABCI the fifth fastest supercomputer on Top500 in June, 2018. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2018-HPC-167,
号 16,
p. 1-8,
発行日 2018-12-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |