Item type |
SIG Technical Reports(1) |
公開日 |
2017-03-01 |
タイトル |
|
|
タイトル |
KNLメニーコア・プロセッサにおけるPGAS言語XcalableMPアプリケーションの性能評価 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
メニーコア最適化 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
筑波大学大学院システム情報工学研究科 |
著者所属 |
|
|
|
筑波大学大学院システム情報工学研究科 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
筑波大学計算科学研究センター/筑波大学大学院システム情報工学研究科 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構/筑波大学大学院システム情報工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems and Information Engineering, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems and Information Engineering, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
Center for Computational Sciences, University of Tsukuba / Graduate School of Systems and Information Engineering, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science / Graduate School of Systems and Information Engineering, University of Tsukuba |
著者名 |
津金, 佳祐
田渕, 晶大
李, 珍泌
村井, 均
朴, 泰祐
佐藤, 三久
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,高性能計算分野において消費電力性能比が良いことからチップ内に多くのコアを搭載したメニーコアプロセッサが注目を集めている.筑波大学と東京大学による最先端共同 HPC 基盤施設 (JCAHPC) が運用する Oakforest-PACS (OFP) システムでは,Intel のメニーコアプロセッサである Knights Landing (KNL) が採用されている.そのようなメニーコア環境における高性能 ・ 高生産性言語として Partitioned Global Address Space (PGAS) 言語 XcalableMP (XMP) が提案されている.本稿では,OFP システムにおいて KNL プロセッサ上での XMP アプリケーションの評価を行い,KNL プロセッサにおける性能特性に関する知見を示す.XMP の性能評価では,対象のアプリケーションを Himeno Benchmark と HPC Challenge Benchmark の Fast Fourier Transform (FFT) とした.OFP の 64 ノードを用いて評価を行ったところ,XMP 実装は Himeno Benchmark で MPI 実装の 97% の性能,FFT では 98% の性能が得られ,どちらも MPI 実装とほぼ同等の性能を得ることができた.現在,XMP はメニーコア対応に向けたバージョン 2.0 の仕様検討が進められている.XMP2.0 では,提案の一つとして比較的性能の低い個々のコアに対して,Omni-Path Architecture など高い通信バンド幅を持つインターコネクトの性能を引き出すために,従来のプロセス単位ではなくスレッド単位による通信が検討されている.XMP2.0 に向けた評価として,単一スレッドと複数スレッドが通信可能な Cholesky Factorization を実装し予備性能評価を行った.複数スレッド通信による Cholesky Factorization の性能は,単一スレッド通信の場合と比較して 77% の性能に留まり,今後性能低下の原因を調査する予定である. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2017-HPC-158,
号 17,
p. 1-9,
発行日 2017-03-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |