@techreport{oai:ipsj.ixsq.nii.ac.jp:00231096, author = {村上, 舜 and 米田, 一徳 and 岩村, 尚 and 渡邉, 正宏 and 井口, 寧 and Shun, Murakami and Kazunori, Yoneda and Takashi, Iwamura and Masahiro, Watanabe and Yasushi, Inoguchi}, issue = {18}, month = {Nov}, note = {近年,数値シミュレーションの複雑化および大規模化に伴い,数百万行を超える規模の行列の要素の多くが 0 である疎行列を係数行列とした連立一次方程式を高速に求解することが求められている.その求解には係数行列の変形が伴わない反復解法が用いられることが多く,主要な計算時間を占める疎行列密ベクトル積(sparse matrix vector products:SpMV)を高速化するために,CPU と比較して高速なメモリ帯域をもつ GPU を活用することにより高速化が図られてきた.大規模な疎行列を,GPU の少ないデバイスメモリへ格納するにあたり,メモリ効率のよい CSR 形式が多く用られている.また,メモリアクセスパターンを改善し高速に SpMV の計算が可能な SELL-C-σ形式が提案されているが,さらなる SpMV の高速化のためには,メモリへのアクセス回数を減らす必要がある.そのため第 190 回 HPC 研究会で,非ゼロ要素位置へ辞書圧縮を適用し,メモリへのアクセスを減らすことによって,GPU 上で SpMV を高速に計算可能な非ゼロ要素位置辞書圧縮疎行列格納形式を提案した.これによって CSR 形式と比較して最大 19.6% の高速化が得られた.これらの改善された格納形式は,SpMV の計算時間は高速化されるが,各形式への変換時間というオーバーヘッドが発生する.本論文では CSR 形式,SELL-C-σ 形式および提案した非ゼロ要素位置辞書圧縮疎行列格納形式について,それぞれ CPU および GPU 上での形式変換時間を評価することによって,形式変換のオーバーヘッドを含めた SpMV 計算高速化の評価を行う.}, title = {疎行列密ベクトル積の高速化のための非ゼロ要素位置辞書圧縮を適用した疎行列格納形式のGPUにおける形式変換の評価}, year = {2023} }