Item type |
SIG Technical Reports(1) |
公開日 |
2023-07-27 |
タイトル |
|
|
タイトル |
CUDA Fortran+MIG+UVMを用いたBLR行列QR分解の大規模高速化 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
数値計算 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
九州大学情報基盤研究開発センター |
著者所属 |
|
|
|
海洋研究開発機構 |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
東京工業大学学術国際情報センター |
著者所属 |
|
|
|
Sandia National Laboratories |
著者所属(英) |
|
|
|
en |
|
|
Sandia National Laboratories |
著者名 |
大島, 聡史
伊田, 明弘
河合, 直聡
横田, 理央
山崎, 市太郎
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
CPU や GPU の演算性能の向上に対してメモリ容量やメモリ速度の向上が遅れている今日,行列を近似して計算を行う近似行列計算法への注目が高まっている.我々は近似行列の一種であるブロック低ランク (Block Low Rank,BLR) 行列に対する QR 分解 (BLR-QR) に取り組んでいる.特に GPU を用いた高速な BLR-QR の実現を目指しており,既に過去の研究においてMulti-Instance GPU (MIG) を用いた BLR-QR の高速化に成功している.本稿ではその際に生じた幾つかの課題を解決するため,CUDA Fortran と MIG と Unified Virtual Memory (UVM) を用いた実装を行い,性能を評価した.その結果,Fortran90 プログラムに対して C/C++ および CUDA C を使わずに GPU 化を行うことができ,GPU に適しない小規模 なGPU カーネルであっても MIG により高性能を得ることが可能であり,UVM を使うことで GPU に収まらないメモリサイズでも容易に実行可能であることが確認できた.この実装(実行)方法は BLR-QR 以外のアプリケーションにとっても有用であることが期待される. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2023-HPC-190,
号 14,
p. 1-8,
発行日 2023-07-27
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |