@techreport{oai:ipsj.ixsq.nii.ac.jp:00234356,
 author = {武田, 一希 and 山田, 浩史},
 issue = {1},
 month = {May},
 note = {ECC-uncorrectable メモリエラー (EMEs) は Error Correcting Code (ECC) 機能で検知できても訂正できないメモリエラーであり,ソフトウェアに対して甚大な被害を及ぼす.特にオペレーティングシステム (OS) カーネル内のメモリ領域において EMEs が発生・検知された場合,OS カーネル上で稼働していたすべてのアプリケーションを巻き込んでクラッシュしてしまうため,アプリケーション再開までのダウンタイムが発生してしまう.その中でも,インメモリアプリケーションの普及により,OSカーネルのメモリオブジェクトであるページテーブルのメモリフットプリントが増加し,ページテーブルにおいて相対的に EMEs が発生する可能性が高い.本研究では,OS カーネル内のページテーブルにおいて EMEs が発生・検知された場合でも,可能な限りシステムの継続実行を指向するページテーブル管理機構を提案し,EMEs の発生下でもシステムクラッシュを回避することでダウンタイムを大幅に削減する.連続するページテーブルエントリが多くの場合に連続する物理ページに変換することに着目し,複数のエントリの内容を圧縮したデータ構造を作成することで,低メモリスペースオーバヘッドでページテーブルを復元する.提案手法のプロトタイプを Linux 6.1.35 に実装して行った評価実験の結果,低メモリスペースオーバヘッドでページテーブルを復元し,システムの継続実行に成功した.},
 title = {ECC-uncorrectableメモリエラーへの耐性を有するページテーブル管理機構},
 year = {2024}
}