WEKO3
アイテム
Linuxカーネルにおけるエラー伝播の調査
https://ipsj.ixsq.nii.ac.jp/records/81853
https://ipsj.ixsq.nii.ac.jp/records/8185347478659-a385-4b96-bd03-e490e6133b98
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-04-30 | |||||||
タイトル | ||||||||
タイトル | Linuxカーネルにおけるエラー伝播の調査 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on the Scope of Error Propagation in Linux | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | OSアーキテクチャ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
慶應大学 | ||||||||
著者所属 | ||||||||
慶應大学/JST CREST | ||||||||
著者所属 | ||||||||
慶應大学/JST CREST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Keio University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Keio University / JST CREST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Keio University / JST CREST | ||||||||
著者名 |
吉村, 剛
× 吉村, 剛
|
|||||||
著者名(英) |
Takeshi, Yoshimura
× Takeshi, Yoshimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | OS カーネルには高い信頼性が求められている.しかし,カーネル内のバグを完全に取り除くことは困難であるため運用時に発生するエラーからリカバリする手法が求められる.本研究では始めにカーネル内で発生するエラー伝播はプロセスコンテキストに閉じるケース (プロセスローカル) とカーネル共有データに及ぶケース(カーネルグローバル)の 2 種類に分類されることを示す.エラー伝播の多くはプロセスローカルであり,カーネルグローバルであってもプロセスコンテキストは高確率でクリティカルセクション内でクラッシュすると予想される.その場合クラッシュが起きたとしてもフェイルしたプロセスをキルするとそれ以外のプロセスは正しく稼働し,デッドロックによりクラッシュ原因となったプロセス外へのエラー伝播が防がれる.分析から得られた特徴を利用してプロセスローカルエラーとカーネルグローバルエラーに対する Linux 2.6.38 の反応をフォールトインジェクションにより調査する.実験では 49 件のクラッシュについて直前に実行した命令を調査し,全てプロセスローカルエラーであることを確認した.また,445 件のプロセスキル後のエラー調査では 66.7% はエラーが表面化せず,デッドロックが発生するケースが 24.0% あることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Operating systems are crucial for achieving high availability of computer systems. Even if applications running on an operating system are highly available, a bug inside the kernel may result in a failure of the entire software stack. The objective of this study is to gain some insight into the development of the Linux kernel more resilient against software faults. In this paper, we show two types of scope of error propagation, process-local and kernel-global. The propagation scope is process-local if the error is confined in the process context that activated it. The scope is kernel-global if the error propagates to other processes' contexts or global data structures. We believe that most errors are process-local and even if errors are kernel-global, most process contexts crashes in the middle of critical sections. Therefore, only if we revoke an erroneous context, most contexts can run correctly otherwise fail-stop with high probability even after the kernel crashes. To investigate kernel reaction against process-local and kernel-global error, we perform a kernel-level fault-injection campaign on Linux 2.6.38. In our experiment, we confirm all of the errors which caused 49 crashes are process-local. We also examine 445 errors caused after killing erroneous process and the result show that 66.7% errors are not manifested and 24.0% errors cause dead-locks. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10444176 | |||||||
書誌情報 |
研究報告システムソフトウェアとオペレーティング・システム(OS) 巻 2012-OS-121, 号 8, p. 1-10, 発行日 2012-04-30 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |