WEKO3
アイテム
AVX2を用いたマルチコンポーネント型多倍長精度行列乗算の高速化
https://ipsj.ixsq.nii.ac.jp/records/210006
https://ipsj.ixsq.nii.ac.jp/records/2100069ab19bf0-3afd-4800-8801-6585eeafa3ef
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-03-08 | |||||||
| タイトル | ||||||||
| タイトル | AVX2を用いたマルチコンポーネント型多倍長精度行列乗算の高速化 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Acceleration of multi-component type multiple precision matrix multiplication using AVX2 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | SIMD | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 静岡理工科大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Shizuoka Institute of Science and Technology | ||||||||
| 著者名 |
幸谷, 智紀
× 幸谷, 智紀
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本稿では,Binary64 (double) 精度の浮動小数点数を複数組み合わせて多倍長精度化するマルチコンポーネント型多倍長精度の行列乗算の高速化を,AVX2 を用いて行った結果について報告する.対象となるのは double-double (DD),triple-double (TD),quad-double (QD) の 3 種類の精度計算であり,それぞれ無誤差変換技法を組み合わせて四則演算を実行できる.今回我々は,4 つの double 型浮動小数点数を同時に操作できる x86_64 上の SIMD 命令である AVX2 を用いて無誤差変換技法を構築し,その上に DD, TD, QD の加算と乗算を実装した.また,行列要素読み書き時の高速性を保つため,AVX2 の load/store 命令を使って行えるようベクトル・行列の構造体を構築した.その結果,ブロッキングした行列乗算,Strassen/Winograd 行列乗算それぞれにおいて最大 3 倍程度の高速化を達成し,併せて OpenMP を用いた並列化効率の向上にも成功した. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10463942 | |||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2021-HPC-178, 号 8, p. 1-9, 発行日 2021-03-08 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8841 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||