WEKO3
アイテム
OpenACCを用いた単精度LU分解のGPU並列化
https://ipsj.ixsq.nii.ac.jp/records/235625
https://ipsj.ixsq.nii.ac.jp/records/2356250f0d4909-7fb9-4bf7-bd9a-c03472dae0eb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2024 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-03-01 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | OpenACCを用いた単精度LU分解のGPU並列化 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
キーワード | ||||||||||||||||
主題Scheme | Other | |||||||||||||||
主題 | コンピュータシステム | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
工学院大 | ||||||||||||||||
著者所属 | ||||||||||||||||
工学院大 | ||||||||||||||||
著者所属 | ||||||||||||||||
工学院大 | ||||||||||||||||
著者所属 | ||||||||||||||||
工学院大 | ||||||||||||||||
著者所属 | ||||||||||||||||
工学院大 | ||||||||||||||||
著者名 |
高山, 智礼
× 高山, 智礼
× 久木田, 仁
× 矢島, 雄河
× 藤井, 昭宏
× 田中, 輝雄
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | 機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た. | |||||||||||||||
書誌レコードID | ||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||
収録物識別子 | AN00349328 | |||||||||||||||
書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 27-28, 発行日 2024-03-01 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |