WEKO3
アイテム
GPUによる3倍精度浮動小数点演算の検討
https://ipsj.ixsq.nii.ac.jp/records/79324
https://ipsj.ixsq.nii.ac.jp/records/79324140e1a7c-b6f3-4b1e-a5f4-3b28350ac626
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2011-11-21 | |||||||
| タイトル | ||||||||
| タイトル | GPUによる3倍精度浮動小数点演算の検討 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 高精度計算 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 筑波大学大学院システム情報工学研究科 | ||||||||
| 著者所属 | ||||||||
| 筑波大学システム情報系 | ||||||||
| 著者名 |
椋木大地
高橋大介
× 椋木大地 高橋大介
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 近年,プロセッサの演算性能向上に対してメモリやネットワークのバンド幅不足が問題となっている.浮動小数点演算において倍精度演算で精度が不足する場合,4 倍精度演算を用いることが検討されてきたが,データアクセス量が少なくて済む 3 倍精度演算が有効となるケースが存在すると考えられる.本研究では 3 倍精度数を倍精度数と単精度数に分けて格納する Double+Single 型 3 倍精度型 (D+S 型) および D+S 型 3 倍精度演算 (D+S 型演算) を提案し,GPU による 3 倍精度の BLAS(Basic Linear Algebra Subprograms) ルーチンを実装して,その性能をTesla C2050 で評価した.D+S 型演算には Double-Double 型 4 倍精度演算 (DD 型演算) のアルゴリズムにおいて一部演算を単精度演算で行う手法を実装したが,倍精度数-単精度数の型変換が多発し D+S 型演算は DD 型演算よりも高コストとなった.そのため BLAS の入出力を D+S 型で行い,演算には DD 型演算を用いる方式を実装した.Tesla C2050 では 3 倍精度 AXPY が CUBLAS の倍精度 AXPY の約 1.57 倍の実行時間,3 倍精度 GEMV が倍精度 GEMV の約 1.69 倍の実行時間となり,それぞれ 4 倍精度ルーチンよりも高速な性能を示した.本稿では GPU における D+S 型および D+S 型演算の有効性について議論する. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10463942 | |||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2011-HPC-132, 号 23, p. 1-9, 発行日 2011-11-21 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||