@techreport{oai:ipsj.ixsq.nii.ac.jp:00107325,
 author = {椋木, 大地 and 今村, 俊幸},
 issue = {26},
 month = {Dec},
 note = {NVIDIA が 2014 年にリリースした Maxwell アーキテクチャの GM107・GM204 コア搭載 GPU は，浮動小数点演算の理論ピーク演算性能比が倍精度:単精度 =1:32 である．このような環境ではソフトウェアで実装した疑似倍精度演算を用いた方が，倍精度の計算を高速に行える可能性がある．本稿では GM204 コアを搭載する GeForce GTX 980 を対象に，単精度型を 2 個連結して倍精度型を表現し，単精度演算で疑似的な倍精度演算を実現する double-float 演算 （DF 演算） を用いて，倍精度行列積を計算する BLAS ルーチンである DGEMM を実装した．その結果，ハードウェアの倍精度演算による通常の DGEMM と比べて，DF 演算を用いた DGEMM は約 2 倍の性能が得られた．},
 title = {MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価},
 year = {2014}
}