@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00235625,
 author = {高山, 智礼 and 久木田, 仁 and 矢島, 雄河 and 藤井, 昭宏 and 田中, 輝雄},
 book = {第86回全国大会講演論文集},
 issue = {1},
 month = {Mar},
 note = {機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た.},
 pages = {27--28},
 publisher = {情報処理学会},
 title = {OpenACCを用いた単精度LU分解のGPU並列化},
 volume = {2024},
 year = {2024}
}