WEKO3
アイテム
GPU 向けソフトウェア ECC の性能評価
https://ipsj.ixsq.nii.ac.jp/records/61362
https://ipsj.ixsq.nii.ac.jp/records/613628a07534f-05e4-494f-89d3-07a9392d6459
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-02-19 | |||||||
タイトル | ||||||||
タイトル | GPU 向けソフトウェア ECC の性能評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance Evaluation of Software-Based ECC for GPUs | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学/JST,CREST | ||||||||
著者所属 | ||||||||
東京工業大学/JST,CREST | ||||||||
著者所属 | ||||||||
東京工業大学/国立情報学研究所/JST,CREST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology / JST,CREST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology / National Institute of Informatics / JST,CREST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology / JST,CREST | ||||||||
著者名 |
丸山, 直也
× 丸山, 直也
|
|||||||
著者名(英) |
Naoya, Maruyama
× Naoya, Maruyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 高い浮動小数点演算性能により、 GPU を HPC 用途に用いる GPGPU が注目されている。しかし、 GPU は本来グラフィックス用途に開発されてきたものであり、 HPC 用途としては耐故障性に不十分な点が存在する。その一つとして、メモリ誤りの検出、訂正が挙げられる。現状の GPU には ECC を備えたものなく、一般的な HPC 計算ノードと比較して信頼性に劣る。我々は、 GPU の信頼性向上のために、ソフトウェアによってメモリ誤りの検出、訂正を行う手法を提案している。本手法では、 GPGPU アプリケーション中に ECC を計算、検査するコードを追加することで、グラフィックスメモリ中のビットフリップなどの誤りを検出、訂正する。提案手法を Nvidia による C 言語拡張 CUDA 向けにライブラリとして実装し、 FFT 、行列積、 N 体問題アプリケーションに適用した。両アプリケーションを用いて、 ECC 計算による性能オーバーヘッドを調査したところ、 FFT 、行列積で最大 300% 程度, N 体問題で 15% 程度のオーバーヘッドになることを確認し、 N 体問題のようにメモリアクセス頻度に対して計算量の多いアプリケーションでは比較的小さなオーバーヘッドで実現可能であることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | General-Purpose Processing on GPUs (GPGPUs) has rapidly been recoginized as a promissing HPC technology because of GPUs' much higher peak floating-point processing power. However, GPUs have originally been developed for graphics applications, such as 3D games, where reliability is not considered as an important issue as in HPC communities. One notable example is the lack of ECC in graphics memory systems. To improve the reliability of GPUs for HPC applications, we propose a software-based technique to generate and check ECC for graphics memory. Our library-based approache allows for CUDA-based GPGPU applications to be easily extended with ECC-based error checking with little manual intervention. To evaluate the applicability of our approach, we extended two CUDA applications with our ECC libarary: 3-D FFT, matrix multiplication, and an N-body problem. Our performance studies showed that while FFT and matrix multiplication can take up to 300% overhead, the N-body application only incurrs 15% of overhead. These results suggest that software-based ECC would be a promissing approach for computation-intensive applications such as N-body problems. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2009, 号 14(2009-HPC-119), p. 25-30, 発行日 2009-02-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |