Item type |
Trans(1) |
公開日 |
2016-03-08 |
タイトル |
|
|
タイトル |
演算加速機構を持つクラスタ向けPGAS言語XcalableACCの評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of A PGAS Language XcalableACC for Accelerator Clusters |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[コンパイラ] 演算加速機構,GPU,クラスタ,PGAS言語 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
筑波大学大学院システム情報工学研究科 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
筑波大学大学院システム情報工学研究科/筑波大学計算科学研究センター |
著者所属 |
|
|
|
筑波大学大学院システム情報工学研究科/国立研究開発法人理化学研究所計算科学研究機構 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems and Information Engineering, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems and Information Engineering, University of Tsukuba / Center for Computational Sciences, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems and Information Engineering, University of Tsukuba / RIKEN Advanced Institute for Computational Science |
著者名 |
田渕, 晶大
中尾, 昌広
村井, 均
朴, 泰祐
佐藤, 三久
|
著者名(英) |
Akihiro, Tabuchi
Masahiro, Nakao
Hitoshi, Murai
Taisuke, Boku
Mitsuhisa, Sato
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
GPUやMICのような演算加速機構を持つクラスタが広く使われている.演算加速機構のプログラミングにOpenACCやOpenMP 4.0を用いてMPIと組み合わせることで,比較的簡易に演算加速機構を持つクラスタ向けのプログラムを記述できるようになったが,それでもなおMPIの記述が煩雑であるため生産性が低いという問題がある.そこで我々はPartitioned Global Address Space(PGAS)言語XcalableMPと演算加速機構プログラミングモデルOpenACCを統合したXcalableACC(XACC)を提案している.XACCでは逐次コードに指示文を追加することにより,演算加速機構を持つクラスタ向けのプログラミングが可能である.本稿では,XACCの通信指示文の一部をNVIDIA GPU向けに実装しベンチマークで性能評価を行った.MPI+OpenACCと比較してHimeno Benchmarkでは最大で97%,NAS Parallel Benchmarks(NPB)CGでは最大で96%の性能を達成した.また指示文による簡潔な記述によりMPI+OpenACCと比較してコード行数をHimeno Benchmarkでは51%,NPB CGでは79%に抑えられたことから,XACCは高い性能と生産性があるといえる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Clusters equipped with accelerators such as GPU and MIC are widely used. For these clusters, programmers can develop their applications relatively easily by combining MPI with OpenACC or OpenMP 4.0, but lower productivity due to complex MPI programming is still a problem. We have been proposing XcalableACC (XACC), which is an integration of a Partitioned Global Address Space (PGAS) language XcalableMP (XMP) and OpenACC. XACC enables programmers to develop applications for accelerator clusters just by adding directives to a serial version of the code. In this paper, we show the implementation of the XACC communication directives for NVIDIA GPU and evaluated their performance using two benchmarks. The performance of the XACC version against MPI+OpenACC version is up to 97% for Himeno Benchmark and up to 96% for NAS Parallel Benchmarks (NPB) CG. The code size of XACC version against MPI+OpenACC version is 51% for Himeno Benchmark and 79% for NPB CG. Therefore, XACC features fully high performance and productivity. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11833852 |
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS)
巻 9,
号 1,
p. 17-29,
発行日 2016-03-08
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7829 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |