@techreport{oai:ipsj.ixsq.nii.ac.jp:00145098, author = {佐々木, 信一 and 菱沼, 利彰 and 藤井, 昭宏 and 田中, 輝雄 and 椋木, 大地 and 今村, 俊幸}, issue = {15}, month = {Sep}, note = {倍々精度演算は Bailey らが考案した ”Double-Double” 精度のアルゴリズム [1] を用いて,倍精度演算の組合せにより四倍精度演算を行う手法である.倍々精度乗算は FMA (積和) 演算器を搭載するプロセッサでは積和演算の中間結果を高精度で保持できアルゴリズム的に演算量を削減できる (FMA アルゴリズム).本研究ではスーパコンピュータ京 [6] および FX10 に搭載されている FMA 演算器と SIMD(Single Instruction Multiple Data) 演算機構を用いて,これらに最適なベクトル演算および疎行列ベクトル積 (疎行列部は倍精度) の高速化手法を提案する.実験の結果,ベクトル演算ではキャッシュ容量に収まる範囲では本手法適用前に比べ約 5 倍,収まらない範囲ではメモリ性能に制約を受けるまで高速化できること,疎行列ベクトル積では高速化手法によりフロリダ行列に対しては最大 4.5 倍の高速化したことを確認した.}, title = {京・FX10における倍々精度演算の高速化}, year = {2015} }