@techreport{oai:ipsj.ixsq.nii.ac.jp:00145091, author = {長坂, 侑亮 and 額田, 彰 and 松岡, 聡}, issue = {8}, month = {Sep}, note = {科学技術計算において巨大で疎な問題行列を持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占めている.疎行列ベクトル積計算の GPU 向けの高速化も数多く行われてきているものの,疎行列ベクトル積計算がメモリバウンドなカーネルであることや入力ベクトルへのランダムアクセスによって発生する局所性低下等が要因となって性能向上が妨げられている.我々は GPU での疎行列ベクトル積計算時のメモリアクセス量とアクセス頻度を効果的に削減する疎行列フォーマットである AMB(Adaptive Multi-level Blocking) フォーマットを提案する.16bit integer の利用と種々のブロッキング手法によって,列インデックスの圧縮を行い,メモリアクセス量の削減を図っている.Florida 大学の疎行列データセットから選出した 40 個の行列に対して,既存手法との比較を行い,cuSparse と比較して最大で 2.81 倍,平均で 1.77 倍の性能向上を果たし,また,近年提案された高速な疎行列ベクトル積ライブラリである yaSpMV と比較して最大で 1.38 倍,平均で 1.13 倍の性能向上を果たした.}, title = {疎行列ベクトル積計算を対象としたGPU向けメモリアクセス削減手法}, year = {2015} }