Item type |
SIG Technical Reports(1) |
公開日 |
2017-07-19 |
タイトル |
|
|
タイトル |
GPUクラスタ上における階層型行列計算の最適化 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
行列計算 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
九州大学情報基盤研究開発センター |
著者所属 |
|
|
|
Electrical Engineering and Computer Science Department, University of Tennessee |
著者所属 |
|
|
|
東京大学情報基盤センター |
著者所属 |
|
|
|
東京工業大学学術国際情報センター |
著者名 |
大島, 聡史
山崎, 市太郎
伊田, 明弘
横田, 理央
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
階層型行列は小さな密行列と低ランク近似行列から構成される行列である.密行列を階層型行列によって近似することで,大規模な計算をより少ないメモリ量で行うことが可能となる.しかし階層型行列を用いた計算は複雑であるため,最適化が求められている.我々はこれまで階層型行列を用いた境界要素法による静電場解析問題の実装と評価をマルチコア CPU やメニーコアプロセッサにて実施してきた.本稿では,階層型行列を係数行列に持つ線形方程式に対する反復法を対象として,GPU クラスタ上での性能評価や最適化に取り組んだ結果を示す.主要な計算部である階層型行列ベクトル積計算を構成する密行列ベクトル積計算を MAGMA BLAS に行わせることで高速化を目指したところ,GPU カーネル起動のオーバーヘッドにより実行時間が増大したが,BATCHED MAGMA を用いることで大幅に性能が改善した.実験環境としては TSUBAME 2.5 (最大 8 ノード / 1 ノードあたり 1 GPU) および Reedbush-H (最大 8 ノード / 1 ノードあたり 1 GPU) を使用し,それぞれ 8 ノードまで性能向上は得られたが,ノード数を増やした場合には MPI 処理の時間も目立ってきており,さらなる最適化が求められる結果となった. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2017-HPC-160,
号 14,
p. 1-8,
発行日 2017-07-19
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |