@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00235625, author = {高山, 智礼 and 久木田, 仁 and 矢島, 雄河 and 藤井, 昭宏 and 田中, 輝雄}, book = {第86回全国大会講演論文集}, issue = {1}, month = {Mar}, note = {機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た.}, pages = {27--28}, publisher = {情報処理学会}, title = {OpenACCを用いた単精度LU分解のGPU並列化}, volume = {2024}, year = {2024} }