2024-03-28T17:52:18Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000875112023-04-27T10:00:04Z01164:02240:06731:06941
GPUにおける4倍精度演算を用いた疎行列反復解法の実装と評価jpnGPU最適化http://id.nii.ac.jp/1001/00087496/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=87511&item_no=1&attribute_id=1&file_no=1Copyright (c) 2012 by the Information Processing Society of Japan筑波大学大学院システム情報工学研究科筑波大学システム情報系椋木大地高橋大介疎行列の反復解法として用いられるクリロフ部分空間法は,丸め誤差の影響によって収束までの反復回数が増加したり,収束しなくなるケースがある.このような場合に高精度演算を用いることで収束性を改善できるケースがあることが報告されている.このとき,高精度演算を行うことによる1反復あたりの計算時間の増大に対して,反復回数の削減による計算時間の短縮効果が大きければ,求解までの計算時間を短縮できる可能性がある.我々は GPU (Tesla M2050) において Double-Double (DD) 演算による 4 倍精度を用いて,クリロフ部分空間法の一つである BiCGStab 法を実装し性能を評価した. GPU 上では 4 倍精度 BiCGStab 法の 1 反復あたりの計算時間が,倍精度の約 1.0-2.2 倍となり,反復回数の削減量によっては, 4 倍精度演算を用いることで求解までの計算時間を短縮できる場合が存在した.本稿では GPU 上の疎行列反復解法における 4 倍精度演算の性能と有効性について検討する.AN10463942研究報告ハイパフォーマンスコンピューティング(HPC)2012-HPC-13737182012-12-062012-11-28