WEKO3
アイテム
AVXを用いた倍々精度疎行列ベクトル積の高速化
https://ipsj.ixsq.nii.ac.jp/records/87831
https://ipsj.ixsq.nii.ac.jp/records/8783158093ea6-848c-4abe-9507-4881ef4b1ba8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-01-08 | |||||||
タイトル | ||||||||
タイトル | AVXを用いた倍々精度疎行列ベクトル積の高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | AVX Acceleration of Sparse Matrix-Vector Multiplication in Double-Double | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
筑波大学図書館情報メディア系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Library, Information and Media Science, University of Tsukuba | ||||||||
著者名 |
菱沼, 利彰
藤井, 昭宏
田中, 輝雄
長谷川, 秀彦
× 菱沼, 利彰 藤井, 昭宏 田中, 輝雄 長谷川, 秀彦
|
|||||||
著者名(英) |
Toshiaki, Hishinuma
Akihiro, Fujii
Teruo, Tanaka
Hidehiko, Hasegawa
× Toshiaki, Hishinuma Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 計算性能の向上に伴い,高精度による計算が多くの場面で可能となっている.4倍精度を効率良く実現する手法として,2つの倍精度変数で1つの4倍精度変数を表現する倍々精度演算がある.本研究では,疎行列とベクトルの演算に使われる基本演算をAVX命令を用いて高速化し,性能を決定するパラメタについて分析を行うことにより,倍々精度演算をAVXで行う際の効果を示した.AVX命令を用いた場合,同時演算数の増加,3オペランド化によるレジスタ退避,復元処理の減少などの効果が大きく,SSE2の性能と比べて,キャッシュに収まる範囲のベクトル間の演算では約1.7から2.3倍の性能となったが,キャッシュに収まらない場合は,キャッシュアクセス,メモリアクセスが大きなボトルネックになることがわかった.倍精度の疎行列と倍々精度のベクトルの積では,約1.1から1.9倍の性能となり,メモリアクセスはボトルネックとならず,疎行列の1行あたりの非零要素の数が性能に大きな影響を与えていることがわかった.これらの結果から,倍々精度の疎行列ベクトル積の性能を予測する1つの指標を導出した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As computing performance is improved generation after generation, high precision computation becomes possible in many situations. One of the efficient methods to perform quadruple precision is to use Double-Double precision which uses two double precision variables for one quadruple precision variable. In this paper, the authors tuned basic operation kernels of sparse matrices and vectors in Double-Double precision using AVX, and analyzed their performance. The AVX speedup ratio of the Double-Double vector operations is from 1.7 to 2.3 when data stored in the cache. The reason of performance acceleration is number of operations in the same time and elimination of backup and recovery values on registers by three operands instruction, The AVX performance decreases when data not stored in the cache, because of cache hit ratio and memory bandwidth. The AVX speedup ratio of the product of Double precision sparse matrix and Double-Double precision vector is from 1.1 to 1.9. An average number of nonzero elements per row affects to the performance, but a memory bandwidth does not affect to the performance. The authors define one metric to forecast the AVX performance of the product of sparse matrix and vector in Double-Double. | |||||||
書誌情報 |
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 巻 2013, p. 23-31, 発行日 2013-01-08 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |