Item type |
SIG Technical Reports(1) |
公開日 |
2018-02-21 |
タイトル |
|
|
タイトル |
メモリアクセスパターン依存故障の注入のためのQEMUベース故障注入器 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
メモリ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京工業大学/産総研・東工大実社会ビッグデータ活用オープンイノベーションラボラトリ |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
東京工業大学/産総研・東工大実社会ビッグデータ活用オープンイノベーションラボラトリ |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology / AIST-TokyoTech Real World Big-Data Computation Open Innovation Laboratory (RWBC- OIL), National Institute of Advanced Industrial Science and Technology (AIST) |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology / AIST-TokyoTech Real World Big-Data Computation Open Innovation Laboratory (RWBC- OIL), National Institute of Advanced Industrial Science and Technology (AIST) |
著者名 |
小林, 佑矢
實本, 英之
野村, 哲弘
松岡, 聡
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,大規模計算機システムでの故障の増加が問題になっている.様々な耐故障技術が開発されたが,オーバーヘッドと耐故障性の間にトレードオフがあり,適切な手法の選択が難しい.耐故障技術の評価には故障注入が用いられるが,既存の故障注入器ではハードウェア特有の故障を再現し,アプリケーションレベルの詳細な解析ができない.我々は,ハードウェアに特有の故障を再現し,アプリケーションレベルの解析を容易に行える故障注入プラットフォームの提供を目的とする.本研究では,故障の主な発生源の一つである DRAM を対象にして,メモリアクセスパターン依存故障をメモリ I / O フックにより注入した上で,耐故障性テスト対象のプロセスのメモリマップ情報を取得できる QEMU ベース故障注入器 MH - QEMU を作成した.評価では,MH - QEMU の故障注入機能使用時には,テスト対象アプリケーションの実行時間が最良の場合でも 77 倍になることを確認した.中でも,メモリインテンシブであったり,ノード間通信が少ないアプリケーションほどオーバーヘッドが大きいことを確認した.また,MH - QEMU で NAS Parallel Benchmark の CG カーネルの耐故障性評価を行い,Row - Hammer 発生時に Silent Data Corruption につながりやすいデータ領域を特定した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2018-HPC-163,
号 8,
p. 1-10,
発行日 2018-02-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |