WEKO3
アイテム
GPUにおける耐故障性を考慮した数値計算の電力性能
https://ipsj.ixsq.nii.ac.jp/records/62787
https://ipsj.ixsq.nii.ac.jp/records/62787729ebfcb-60b5-437a-b67f-498f81b8aee2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-07-28 | |||||||
タイトル | ||||||||
タイトル | GPUにおける耐故障性を考慮した数値計算の電力性能 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Power-Performance Evaluation of Fault Tolerant Numerics on GPUs | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 省電力化 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学/科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京工業大学/科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京工業大学/科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京工業大学/科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京工業大学/科学技術振興機構/国立情報学研究所 | ||||||||
著者名 |
島田, 大地
× 島田, 大地
|
|||||||
著者名(英) |
Daichi, Shimada
× Daichi, Shimada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、GPU は画像処理以外に科学技術計算への応用として多くの現場で用いられてきている。しかし、広く用いられてきている反面、GPU に対しての耐故障性は考えられてきていない。耐故障性が考えられていないと一時的な故障が生じた時にプログラムが正しく実行しなくなる可能性があり信頼性が低下する。これまで GPU は主に性能のみについて考えられてきており、信頼性向上手法については十分に議論されていない。そのため、GPU への信頼性の向上と電力性能のコストのトレードオフを検討する必要があるが、十分な評価がされていない。本研究では、CPU に対しての既存の耐過渡故障技術の一つである多重計算を GPU に実装し、評価した。行列積を対象に実装し、評価した結果、元の行列積の 1.88 倍のエネルギーで耐故障性を得ることができることが分かった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, GPU is becoming a viable commodity for not only graphics processing but also scientific computation requiring enormous amount of calculation. However, fault tolerance has not been considered for the calculation in GPUs. Soft errors such as bit ips can produce wrong results unless any fault-tolerance techniques are employed. To establish the guideline toward performance-power efficient fault tolerant GPU computing, we examine redundant computation in matrix multiplication. We implemented eight different versions of redundant matrix multiplication and examined the impact of the power-performance of each version. Our redundant matrix multiplication implementation achieved higher reliability than that of CUDA SDK matrix multiplication with 1.88x energy increase. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2009-HPC-121, 号 26, p. 1-6, 発行日 2009-07-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |