Item type |
SIG Technical Reports(1) |
公開日 |
2015-09-23 |
タイトル |
|
|
タイトル |
京・FX10における倍々精度演算の高速化 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
数値計算 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
工学院大学 |
著者所属 |
|
|
|
筑波大学 |
著者所属 |
|
|
|
工学院大学 |
著者所属 |
|
|
|
工学院大学 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所計算科学研究機構 |
著者名 |
佐々木, 信一
菱沼, 利彰
藤井, 昭宏
田中, 輝雄
椋木, 大地
今村, 俊幸
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
倍々精度演算は Bailey らが考案した ”Double-Double” 精度のアルゴリズム [1] を用いて,倍精度演算の組合せにより四倍精度演算を行う手法である.倍々精度乗算は FMA (積和) 演算器を搭載するプロセッサでは積和演算の中間結果を高精度で保持できアルゴリズム的に演算量を削減できる (FMA アルゴリズム).本研究ではスーパコンピュータ京 [6] および FX10 に搭載されている FMA 演算器と SIMD(Single Instruction Multiple Data) 演算機構を用いて,これらに最適なベクトル演算および疎行列ベクトル積 (疎行列部は倍精度) の高速化手法を提案する.実験の結果,ベクトル演算ではキャッシュ容量に収まる範囲では本手法適用前に比べ約 5 倍,収まらない範囲ではメモリ性能に制約を受けるまで高速化できること,疎行列ベクトル積では高速化手法によりフロリダ行列に対しては最大 4.5 倍の高速化したことを確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2015-HPC-151,
号 15,
p. 1-7,
発行日 2015-09-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |