ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS)
  4. 2013

AVXを用いた倍々精度疎行列ベクトル積の高速化

https://ipsj.ixsq.nii.ac.jp/records/87831
https://ipsj.ixsq.nii.ac.jp/records/87831
58093ea6-848c-4abe-9507-4881ef4b1ba8
名前 / ファイル ライセンス アクション
IPSJ-HPCS2013003.pdf IPSJ-HPCS2013003.pdf (1.4 MB)
Copyright (c) 2013 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2013-01-08
タイトル
タイトル AVXを用いた倍々精度疎行列ベクトル積の高速化
タイトル
言語 en
タイトル AVX Acceleration of Sparse Matrix-Vector Multiplication in Double-Double
言語
言語 jpn
キーワード
主題Scheme Other
主題 数値計算
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
工学院大学情報学部
著者所属
工学院大学情報学部
著者所属
工学院大学情報学部
著者所属
筑波大学図書館情報メディア系
著者所属(英)
en
Faculty of Informatics, Kogakuin University
著者所属(英)
en
Faculty of Informatics, Kogakuin University
著者所属(英)
en
Faculty of Informatics, Kogakuin University
著者所属(英)
en
Faculty of Library, Information and Media Science, University of Tsukuba
著者名 菱沼, 利彰 藤井, 昭宏 田中, 輝雄 長谷川, 秀彦

× 菱沼, 利彰 藤井, 昭宏 田中, 輝雄 長谷川, 秀彦

菱沼, 利彰
藤井, 昭宏
田中, 輝雄
長谷川, 秀彦

Search repository
著者名(英) Toshiaki, Hishinuma Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa

× Toshiaki, Hishinuma Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa

en Toshiaki, Hishinuma
Akihiro, Fujii
Teruo, Tanaka
Hidehiko, Hasegawa

Search repository
論文抄録
内容記述タイプ Other
内容記述 計算性能の向上に伴い,高精度による計算が多くの場面で可能となっている.4倍精度を効率良く実現する手法として,2つの倍精度変数で1つの4倍精度変数を表現する倍々精度演算がある.本研究では,疎行列とベクトルの演算に使われる基本演算をAVX命令を用いて高速化し,性能を決定するパラメタについて分析を行うことにより,倍々精度演算をAVXで行う際の効果を示した.AVX命令を用いた場合,同時演算数の増加,3オペランド化によるレジスタ退避,復元処理の減少などの効果が大きく,SSE2の性能と比べて,キャッシュに収まる範囲のベクトル間の演算では約1.7から2.3倍の性能となったが,キャッシュに収まらない場合は,キャッシュアクセス,メモリアクセスが大きなボトルネックになることがわかった.倍精度の疎行列と倍々精度のベクトルの積では,約1.1から1.9倍の性能となり,メモリアクセスはボトルネックとならず,疎行列の1行あたりの非零要素の数が性能に大きな影響を与えていることがわかった.これらの結果から,倍々精度の疎行列ベクトル積の性能を予測する1つの指標を導出した.
論文抄録(英)
内容記述タイプ Other
内容記述 As computing performance is improved generation after generation, high precision computation becomes possible in many situations. One of the efficient methods to perform quadruple precision is to use Double-Double precision which uses two double precision variables for one quadruple precision variable. In this paper, the authors tuned basic operation kernels of sparse matrices and vectors in Double-Double precision using AVX, and analyzed their performance. The AVX speedup ratio of the Double-Double vector operations is from 1.7 to 2.3 when data stored in the cache. The reason of performance acceleration is number of operations in the same time and elimination of backup and recovery values on registers by three operands instruction, The AVX performance decreases when data not stored in the cache, because of cache hit ratio and memory bandwidth. The AVX speedup ratio of the product of Double precision sparse matrix and Double-Double precision vector is from 1.1 to 1.9. An average number of nonzero elements per row affects to the performance, but a memory bandwidth does not affect to the performance. The authors define one metric to forecast the AVX performance of the product of sparse matrix and vector in Double-Double.
書誌情報 ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集

巻 2013, p. 23-31, 発行日 2013-01-08
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 17:01:00.472412
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3