反復法ライブラリ向け倍々精度演算のAVXを用いた高速化

菱沼, 利彰; 浅川, 圭介; 藤井, 昭宏; 田中, 輝雄; 長谷川, 秀彦; Toshiaki, Hishinuma; Keisuke, Asakawa; Akihiro, Fujii; Teruo, Tanaka; Hidehiko, Hasegawa

WEKO3

インデックスツリー

RootNode

アイテム

反復法ライブラリ向け倍々精度演算のAVXを用いた高速化

https://ipsj.ixsq.nii.ac.jp/records/83295

名前 / ファイル	ライセンス	アクション
IPSJ-HPC12135016.pdf (571.4 kB)	Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2012-07-25

タイトル

反復法ライブラリ向け倍々精度演算のAVXを用いた高速化

タイトル

言語

タイトル

Acceleration of Double-Double Precision Operation for Iterative Solver Library using AVX

言語

jpn

キーワード

主題Scheme

Other

主題

数値計算ライブラリ

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

工学院大学情報学部

著者所属

インターフェイス株式会社

著者所属

工学院大学情報学部

著者所属

工学院大学情報学部

著者所属

筑波大学図書館情報メディア系

著者所属(英)

Faculty of Informatics, Kogakuin University

著者所属(英)

Interface Co.,Ltd.

著者所属(英)

Faculty of Informatics, Kogakuin University

著者所属(英)

Faculty of Informatics, Kogakuin University

著者所属(英)

Faculty of Library, Information and Media Science University of Tsukuba

著者名

菱沼, 利彰浅川, 圭介藤井, 昭宏田中, 輝雄長谷川, 秀彦

著者名(英)

Toshiaki, Hishinuma Keisuke, Asakawa Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa

論文抄録

内容記述タイプ

Other

内容記述

計算性能の向上に伴い，高精度で計算を行うことが多くの場面で必要になってきている．4 倍精度で効率良く計算する手法の中に，倍精度変数を 2 つ用いて 1 つの変数の値を保持する倍々精度演算がある．反復解法ライブリ Lis ではこの倍々精度演算が SSE2 を用いて実装されている．本研究ではその内部使われているベクトル演算を AVX 命令を用いてベクトル長を伸ばし、高速化を行った．その結果，ベクトル演算のデータが L3 キャッシュに収まる場合には，SSE2 版と比較して最大 1.4 ～ 2.3 倍の高速化が実現できた．

論文抄録(英)

内容記述タイプ

Other

内容記述

As computing performance increases generation after generation, high precision calculation comes to be needed in many situations. One of the efficient methods to calculate in quadruple precision is to use double-double precision routines which use two double precision variables for one quadruple precision variable. The iterative solver library Lis has vectorized double-double precision routines with SSE2. In order to accelerate these routines, this paper implemented double-double precision vector operation of Lis by using AVX instructions instead of SSE2. Our vector operation routines with AVX achieved up to 2.3 times speed up from the same routines with SSE2, when vector data is included in L3 cache.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10463942

書誌情報

研究報告ハイパフォーマンスコンピューティング（HPC）

巻 2012-HPC-135, 号 16, p. 1-6, 発行日 2012-07-25

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 18:37:14.487725

Show All versions

Cite as

長谷川, 秀彦, 2012: 情報処理学会, 1–6 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

反復法ライブラリ向け倍々精度演算のAVXを用いた高速化

× 菱沼, 利彰浅川, 圭介藤井, 昭宏田中, 輝雄長谷川, 秀彦

× Toshiaki, Hishinuma Keisuke, Asakawa Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

反復法ライブラリ向け倍々精度演算のAVXを用いた高速化

× 菱沼, 利彰 浅川, 圭介 藤井, 昭宏 田中, 輝雄 長谷川, 秀彦

× Toshiaki, Hishinuma Keisuke, Asakawa Akihiro, Fujii Teruo, Tanaka Hidehiko, Hasegawa

Versions

Share

Cite as

エクスポート

× 菱沼, 利彰浅川, 圭介藤井, 昭宏田中, 輝雄長谷川, 秀彦