@techreport{oai:ipsj.ixsq.nii.ac.jp:00174473,
 author = {長坂, 侑亮 and 額田, 彰 and 松岡, 聡},
 issue = {15},
 month = {Sep},
 note = {AMG 法など反復解法の前処理において用いられる疎行列疎行列積計算は,ランダムなメモリアクセスによって性能向上が困難であることに加え,出力される行列の非ゼロ要素配置が計算開始時には不明であるという特徴を持つ.GPU での高速化を目的とした既存のアルゴリズムでは,実際に出力行列に必要となるメモリ使用量と比べて多大なメモリを要するため,適用可能な行列が制限されている.適切な場合分けとシェアードメモリの活用によってメモリの使用量を抑えることで広範な行列に対して適用可能であり,かつ更なる高性能化を実現する GPU での疎行列疎行列積計算手法を提案する.様々な特性を持つ 12 個の行列に対して Maxwell 世代 GPU にて性能評価を行い,既存の疎行列計算ライブラリから単精度で最大 4.77倍,倍精度で最大 3.84 倍の性能向上を達成した.},
 title = {メモリ使用量を抑えた疎行列疎行列積計算のGPU高速化},
 year = {2016}
}