WEKO3
アイテム
GPUクラスタにおけるGPUセルフMPIシステムGMPIの予備性能評価
https://ipsj.ixsq.nii.ac.jp/records/174129
https://ipsj.ixsq.nii.ac.jp/records/17412962b6a8d4-77c6-41bb-83f0-7895f21bc312
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2016-08-01 | |||||||||||
| タイトル | ||||||||||||
| タイトル | GPUクラスタにおけるGPUセルフMPIシステムGMPIの予備性能評価 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | GPU | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 筑波大学大学院システム情報工学研究科 | ||||||||||||
| 著者所属 | ||||||||||||
| 東京大学情報基盤センター | ||||||||||||
| 著者所属 | ||||||||||||
| 筑波大学大学院システム情報工学研究科/筑波大学計算科学研究センター | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Graduate School of System and Information Engineering, University of Tsukuba | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Information Technology Center, The University of Tokyo | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Graduate School of System and Information Engineering, University of Tsukuba / Center for Computational Sciences, University of Tsukuba | ||||||||||||
| 著者名 |
桑原, 悠太
× 桑原, 悠太
× 塙, 敏博
× 朴, 泰祐
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 今日,CUDA (Compute Unified Device Architecture) は NVIDIA の GPU のプログラミング環境として一般的に用いられている.その高性能かつ低電力な特徴から,GPU クラスタに搭載された GPU は様々なアプリケーションの実行に用いられる.CUDA はシングルノード向けに開発されたため,ノード間での通信には MPI (Message Passing Interface) などを用いる必要がある.従来手法では,通信の度に制御を CUDA カーネルから CPU に戻す必要があり,カーネル関数の起動や同期に伴うオーバーヘッドが生じる他,プログラマビリティや生産性の低下も問題となっている.これらの問題を解決するために,我々は GPU カーネル内から MPI 通信の起動を可能とする並列通信システム “GMPI” を開発している.本稿では,この GMPI システムにおける並列実行モデルを定義し,Ping-Pong 通信および姫野ベンチマークの性能評価を実 GPU クラスタ上で行う.現状,Ping-Pong 通信は従来手法とほぼ同等の性能である.しかしながら,性能最適化やチューニングが十分でなく,姫野ベンチマークでは従来手法の約 66%の性能にとどまっており,この妨げとなる要因の考察を行う. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10463942 | |||||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2016-HPC-155, 号 15, p. 1-8, 発行日 2016-08-01 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8841 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||