| Item type |
National Convention(1) |
| 公開日 |
2024-03-01 |
| タイトル |
|
|
タイトル |
OpenACCを用いた単精度LU分解のGPU並列化 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
コンピュータシステム |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
工学院大 |
| 著者所属 |
|
|
|
工学院大 |
| 著者所属 |
|
|
|
工学院大 |
| 著者所属 |
|
|
|
工学院大 |
| 著者所属 |
|
|
|
工学院大 |
| 著者名 |
高山, 智礼
久木田, 仁
矢島, 雄河
藤井, 昭宏
田中, 輝雄
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
| 書誌情報 |
第86回全国大会講演論文集
巻 2024,
号 1,
p. 27-28,
発行日 2024-03-01
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |