WEKO3
アイテム
尾崎スキームを用いた6倍精度(Triple-Double) LU分解の高速化
https://ipsj.ixsq.nii.ac.jp/records/220224
https://ipsj.ixsq.nii.ac.jp/records/22022472cf9088-0571-48ae-85d5-028a4e831a7e
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-09-19 | |||||||||
| タイトル | ||||||||||
| タイトル | 尾崎スキームを用いた6倍精度(Triple-Double) LU分解の高速化 | |||||||||
| タイトル | ||||||||||
| 言語 | en | |||||||||
| タイトル | Acceleration of Triple-double LU decomposition using Ozaki scheme | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 性能評価 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 静岡理工科大学大学院 | ||||||||||
| 著者所属 | ||||||||||
| 静岡理工科大学 | ||||||||||
| 著者名 |
打桐, 大雅
× 打桐, 大雅
× 幸谷, 智紀
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 標準的な浮動小数点数である Double 型 (IEEE754 binary64) や Single 型 (binary32) よりも長い桁数を表す方法の 1 つにマルチコンポーネント方式が存在し,代表的な実装としては Bailey らによって開発された QD ライブラリがある.QD ライブラリは QD (Quadruple-Double) 型と DD (Double-Double) 型の 2 つの型から構成されている.その中間のデータ型として TD (Triple-Double) 型があり,我々は既に CPU 上において尾崎スキームを用いて TD 精度の行列積を高速化できることを示した.本論文では,この TD 精度行列積を用いた LU 分解を実装する方法を提案し,ベンチマークによって尾崎スキームを用いない場合よりも高速化できることを示す. | |||||||||
| 論文抄録(英) | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | Multi-component-type multiple precision (MP) floating-point arithmetic, which is utilized with array of IEEE754 binary64 or binary32 variables as component, is one of the most efficient implementation. QD library by Bailey et.al., which is representative multi-component-type MP library, has Quad-double (QD) and Double-double (DD) data types. Triple-double (TD) precision arithmetic is located between DD and QD precision arithmetic. We have already demonstrated the effectiveness of TD matrix multiplication thanks to Ozaki scheme. To expand this result to TD LU decomposition, we propose the way of TD LU decomposition with TD matrix multiplication including Ozaki scheme, and show that it is more efficient than without Ozaki scheme through our benchmark tests. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10463942 | |||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2022-HPC-186, 号 2, p. 1-6, 発行日 2022-09-19 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8841 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||