ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2021
  4. 2021-HPC-178

AVX2を用いたマルチコンポーネント型多倍長精度行列乗算の高速化

https://ipsj.ixsq.nii.ac.jp/records/210006
https://ipsj.ixsq.nii.ac.jp/records/210006
9ab19bf0-3afd-4800-8801-6585eeafa3ef
名前 / ファイル ライセンス アクション
IPSJ-HPC21178008.pdf IPSJ-HPC21178008.pdf (1.2 MB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2021-03-08
タイトル
タイトル AVX2を用いたマルチコンポーネント型多倍長精度行列乗算の高速化
タイトル
言語 en
タイトル Acceleration of multi-component type multiple precision matrix multiplication using AVX2
言語
言語 jpn
キーワード
主題Scheme Other
主題 SIMD
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
静岡理工科大学
著者所属(英)
en
Shizuoka Institute of Science and Technology
著者名 幸谷, 智紀

× 幸谷, 智紀

幸谷, 智紀

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,Binary64 (double) 精度の浮動小数点数を複数組み合わせて多倍長精度化するマルチコンポーネント型多倍長精度の行列乗算の高速化を,AVX2 を用いて行った結果について報告する.対象となるのは double-double (DD),triple-double (TD),quad-double (QD) の 3 種類の精度計算であり,それぞれ無誤差変換技法を組み合わせて四則演算を実行できる.今回我々は,4 つの double 型浮動小数点数を同時に操作できる x86_64 上の SIMD 命令である AVX2 を用いて無誤差変換技法を構築し,その上に DD, TD, QD の加算と乗算を実装した.また,行列要素読み書き時の高速性を保つため,AVX2 の load/store 命令を使って行えるようベクトル・行列の構造体を構築した.その結果,ブロッキングした行列乗算,Strassen/Winograd 行列乗算それぞれにおいて最大 3 倍程度の高速化を達成し,併せて OpenMP を用いた並列化効率の向上にも成功した.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2021-HPC-178, 号 8, p. 1-9, 発行日 2021-03-08
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8841
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 18:18:36.640398
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3