Item type |
SIG Technical Reports(1) |
公開日 |
2016-08-01 |
タイトル |
|
|
タイトル |
仮想マシンエミュレータを用いた特定故障パターン発生時におけるアプリケーションの誤差の評価 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
耐故障システム |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学 |
著者名 |
小林, 佑矢
實本, 英之
野村, 哲弘
松岡, 聡
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
高性能計算機の規模は年々大きくなっている.大規模化に伴う故障率の増加により,Silent Data Corruption (SDC) と呼ばれる問題が深刻になると予想されている.SDC はアプリケーションが異常な結果を出力するが,停止には至らないため計算結果の誤りを検知できない障害である.SDC に対処するため多くの研究が行われたが,計算機の変化とともに故障の種類や発生傾向も変化しており,新たな耐故障手法が求められている.本研究は連続したメモリデータの破壊または複数のビットエラーが DRAM 上に発生した際に,NAS Parallel Benchmark の CG カーネルに現れる SDC の調査を目的とする.またそのために,DRAM に特定の故障パターンを注入する故障発生器を,仮想マシンエミュレータである QEMU を拡張して作成した.これにより,SDC が発生しうること,アプリケーションの特性により SDC の発生割合が約 5%減少することを確認した.また連続したデータ破壊が発生したとき,アプリケーションは約 80%の割合で正常な結果を返すが,同じビット数のビットエラーを注入した際には約 90%の割合で異常終了することを確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2016-HPC-155,
号 10,
p. 1-7,
発行日 2016-08-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |