WEKO3
-
RootNode
アイテム
反復法ライブラリ向け倍々精度演算のAVXを用いた高速化
https://ipsj.ixsq.nii.ac.jp/records/83295
https://ipsj.ixsq.nii.ac.jp/records/832954a91c076-b254-499f-9181-bad05f35abc4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-07-25 | |||||||
タイトル | ||||||||
タイトル | 反復法ライブラリ向け倍々精度演算のAVXを用いた高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Acceleration of Double-Double Precision Operation for Iterative Solver Library using AVX | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算ライブラリ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
インターフェイス株式会社 | ||||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
工学院大学情報学部 | ||||||||
著者所属 | ||||||||
筑波大学図書館情報メディア系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interface Co.,Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Library, Information and Media Science University of Tsukuba | ||||||||
著者名 |
菱沼, 利彰
浅川, 圭介
藤井, 昭宏
田中, 輝雄
長谷川, 秀彦
× 菱沼, 利彰 浅川, 圭介 藤井, 昭宏 田中, 輝雄 長谷川, 秀彦
|
|||||||
著者名(英) |
Toshiaki, Hishinuma
Keisuke, Asakawa
Akihiro, Fujii
Teruo, Tanaka
Hidehiko, Hasegawa
× Toshiaki, Hishinuma Keisuke, Asakawa Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 計算性能の向上に伴い,高精度で計算を行うことが多くの場面で必要になってきている.4 倍精度で効率良く計算する手法の中に,倍精度変数を 2 つ用いて 1 つの変数の値を保持する倍々精度演算がある.反復解法ライブリ Lis ではこの倍々精度演算が SSE2 を用いて実装されている.本研究ではその内部使われているベクトル演算を AVX 命令を用いてベクトル長を伸ばし、高速化を行った.その結果,ベクトル演算のデータが L3 キャッシュに収まる場合には,SSE2 版と比較して最大 1.4 ~ 2.3 倍の高速化が実現できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As computing performance increases generation after generation, high precision calculation comes to be needed in many situations. One of the efficient methods to calculate in quadruple precision is to use double-double precision routines which use two double precision variables for one quadruple precision variable. The iterative solver library Lis has vectorized double-double precision routines with SSE2. In order to accelerate these routines, this paper implemented double-double precision vector operation of Lis by using AVX instructions instead of SSE2. Our vector operation routines with AVX achieved up to 2.3 times speed up from the same routines with SSE2, when vector data is included in L3 cache. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2012-HPC-135, 号 16, p. 1-6, 発行日 2012-07-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |