ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2011
  4. 2011-HPC-132

GPUによる3倍精度浮動小数点演算の検討

https://ipsj.ixsq.nii.ac.jp/records/79324
https://ipsj.ixsq.nii.ac.jp/records/79324
140e1a7c-b6f3-4b1e-a5f4-3b28350ac626
名前 / ファイル ライセンス アクション
IPSJ-HPC11132023.pdf IPSJ-HPC11132023.pdf (427.9 kB)
Copyright (c) 2011 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2011-11-21
タイトル
タイトル GPUによる3倍精度浮動小数点演算の検討
言語
言語 jpn
キーワード
主題Scheme Other
主題 高精度計算
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
筑波大学大学院システム情報工学研究科
著者所属
筑波大学システム情報系
著者名 椋木大地 高橋大介

× 椋木大地 高橋大介

椋木大地
高橋大介

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,プロセッサの演算性能向上に対してメモリやネットワークのバンド幅不足が問題となっている.浮動小数点演算において倍精度演算で精度が不足する場合,4 倍精度演算を用いることが検討されてきたが,データアクセス量が少なくて済む 3 倍精度演算が有効となるケースが存在すると考えられる.本研究では 3 倍精度数を倍精度数と単精度数に分けて格納する Double+Single 型 3 倍精度型 (D+S 型) および D+S 型 3 倍精度演算 (D+S 型演算) を提案し,GPU による 3 倍精度の BLAS(Basic Linear Algebra Subprograms) ルーチンを実装して,その性能をTesla C2050 で評価した.D+S 型演算には Double-Double 型 4 倍精度演算 (DD 型演算) のアルゴリズムにおいて一部演算を単精度演算で行う手法を実装したが,倍精度数-単精度数の型変換が多発し D+S 型演算は DD 型演算よりも高コストとなった.そのため BLAS の入出力を D+S 型で行い,演算には DD 型演算を用いる方式を実装した.Tesla C2050 では 3 倍精度 AXPY が CUBLAS の倍精度 AXPY の約 1.57 倍の実行時間,3 倍精度 GEMV が倍精度 GEMV の約 1.69 倍の実行時間となり,それぞれ 4 倍精度ルーチンよりも高速な性能を示した.本稿では GPU における D+S 型および D+S 型演算の有効性について議論する.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2011-HPC-132, 号 23, p. 1-9, 発行日 2011-11-21
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 20:17:17.546767
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3