@techreport{oai:ipsj.ixsq.nii.ac.jp:00101401,
 author = {長坂侑亮 and 額田彰 and 松岡聡},
 issue = {5},
 month = {May},
 note = {巨大な疎行列を係数行列として持つ連立一次方程式を解く際,疎行列ベクトル積計算が実行時間の大部分を占める.GPU などのメニーコアプロセッサはキャッシュ容量が小さいため,入力ベクトル要素へのランダムアクセスによって多数のキャッシュミスが生じる.そのため疎行列ベクトル積計算性能は著しく低い.我々はメニーコア環境においても高いキャッシュヒット率を達成するために,行列を列方向で分割することで各処理内での入力ベクトル要素の再利用性を向上させたフォーマットと疎行列ベクトル積カーネルを新たに提案する.Florida のデータセットから選出した行列に対して既存手法との比較を行った.その結果,疎行列ベクトル積計算について 2.0 倍,CG 法について 1.12 倍の性能向上を果たした.},
 title = {GPUのキャッシュを考慮した疎行列ベクトル積計算手法の性能評価},
 year = {2014}
}