@techreport{oai:ipsj.ixsq.nii.ac.jp:00062787, author = {島田, 大地 and 丸山, 直也 and 額田, 彰 and 遠藤, 敏夫 and 松岡, 聡 and Daichi, Shimada and Naoya, Maruyama and Akira, Nukada and Toshio, Endo and Satoshi, Matsuoka}, issue = {26}, month = {Jul}, note = {近年、GPU は画像処理以外に科学技術計算への応用として多くの現場で用いられてきている。しかし、広く用いられてきている反面、GPU に対しての耐故障性は考えられてきていない。耐故障性が考えられていないと一時的な故障が生じた時にプログラムが正しく実行しなくなる可能性があり信頼性が低下する。これまで GPU は主に性能のみについて考えられてきており、信頼性向上手法については十分に議論されていない。そのため、GPU への信頼性の向上と電力性能のコストのトレードオフを検討する必要があるが、十分な評価がされていない。本研究では、CPU に対しての既存の耐過渡故障技術の一つである多重計算を GPU に実装し、評価した。行列積を対象に実装し、評価した結果、元の行列積の 1.88 倍のエネルギーで耐故障性を得ることができることが分かった。, Recently, GPU is becoming a viable commodity for not only graphics processing but also scientific computation requiring enormous amount of calculation. However, fault tolerance has not been considered for the calculation in GPUs. Soft errors such as bit ips can produce wrong results unless any fault-tolerance techniques are employed. To establish the guideline toward performance-power efficient fault tolerant GPU computing, we examine redundant computation in matrix multiplication. We implemented eight different versions of redundant matrix multiplication and examined the impact of the power-performance of each version. Our redundant matrix multiplication implementation achieved higher reliability than that of CUDA SDK matrix multiplication with 1.88x energy increase.}, title = {GPUにおける耐故障性を考慮した数値計算の電力性能}, year = {2009} }