@techreport{oai:ipsj.ixsq.nii.ac.jp:00190673, author = {石黒, 史也 and 片桐, 孝洋 and 大島, 聡史 and 永井, 亨 and 荻野, 正雄}, issue = {32}, month = {Jul}, note = {基本線形代数サブプログラム BLAS は多くの線形計算で必須であるが,演算精度に関する考慮が不十分であることが多い.一方,倍精度演算による精度を保証する高精度行列-行列積アルゴリズムが知られている.また,複数の BLAS 演算をまとめて実行することで演算効率を向上させる,Batched BLAS という数値計算ライブラリが近年提案されている.本研究では,高精度行列 - 行列積アルゴリズムに Batched BLAS を適用した実装方式を提案するとともに,演算の途中で密行列から疎行列になる特性を利用した 「疎行列 - 密行列」 実装方式の演算性能について,東京大学に設置されている Reedbush - H システムの GPU 環境を利用して性能評価を行った.性能評価の結果,Batched BLAS を適用することで CPU 環境で最大 58.9%,GPU 環境で最大で 25.7% まで実行時間が短縮された.}, title = {GPGPUによる高精度行列-行列積アルゴリズムのためのBatched BLASを用いた実装方式の提案}, year = {2018} }