@techreport{oai:ipsj.ixsq.nii.ac.jp:00174124, author = {小林, 佑矢 and 實本, 英之 and 野村, 哲弘 and 松岡, 聡}, issue = {10}, month = {Aug}, note = {高性能計算機の規模は年々大きくなっている.大規模化に伴う故障率の増加により,Silent Data Corruption (SDC) と呼ばれる問題が深刻になると予想されている.SDC はアプリケーションが異常な結果を出力するが,停止には至らないため計算結果の誤りを検知できない障害である.SDC に対処するため多くの研究が行われたが,計算機の変化とともに故障の種類や発生傾向も変化しており,新たな耐故障手法が求められている.本研究は連続したメモリデータの破壊または複数のビットエラーが DRAM 上に発生した際に,NAS Parallel Benchmark の CG カーネルに現れる SDC の調査を目的とする.またそのために,DRAM に特定の故障パターンを注入する故障発生器を,仮想マシンエミュレータである QEMU を拡張して作成した.これにより,SDC が発生しうること,アプリケーションの特性により SDC の発生割合が約 5%減少することを確認した.また連続したデータ破壊が発生したとき,アプリケーションは約 80%の割合で正常な結果を返すが,同じビット数のビットエラーを注入した際には約 90%の割合で異常終了することを確認した.}, title = {仮想マシンエミュレータを用いた特定故障パターン発生時におけるアプリケーションの誤差の評価}, year = {2016} }