WEKO3
アイテム
ECC-uncorrectableメモリエラーに耐性を有する機械学習フレームワーク
https://ipsj.ixsq.nii.ac.jp/records/2002118
https://ipsj.ixsq.nii.ac.jp/records/2002118ce3a7d74-0e49-4ea7-acf0-c9675a64b633
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2027年5月14日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, OS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2025-05-14 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | ECC-uncorrectableメモリエラーに耐性を有する機械学習フレームワーク | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東京農工大学 | ||||||||||
著者所属 | ||||||||||
東京農工大学 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Tokyo University of Agriculture and Technology | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Tokyo University of Agriculture and Technology | ||||||||||
著者名 |
奥,幸弘
× 奥,幸弘
× 山田,浩史
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | ECC-uncorrectableメモリエラー(EMEs)はコンピュータのメモリで発生するエラーのうち,検出可能かつ自動的な訂正が不可能なエラーである.一般的なオペレーティングシステム(OS)では,EMEsが検出されると発生箇所のメモリにマッピングを持つプロセスを直ちに強制終了する.機械学習を行うアプリケーション(MLアプリ)はメモリを大量に使用して大規模かつ長期間に渡って実行されるためEMEsが発生しやすいと同時に,EMEsが発生するとメモリ上の学習データ等が失われるか,または実行が中断され大きな時間的損失が発生する.このようなMLアプリは多くがPython言語を用いて作成されインタプリタ上で実行されている.本研究では,Pythonアプリケーションに対してEMEsが発生した際の強制終了を防ぎ,メモリエラーを適切に修正して正常に継続実行させるための手法を提案する.EMEs発生時のメモリ上オブジェクトは殆どの部分で健全であることに着目し,EMEs発生箇所のみをピンポイントで修復することにより継続実行を実現する.本研究では提案手法をCPython 3.12.4上に実装し,研究の第一歩目として,リカバリハンドラを備えたChain Hash及びB+-Treeを作成した.これを実行して性能を評価した結果,提案手法は標準の実装と比較して1.5倍以下のメモリ使用,1.4倍以下の処理時間で動作し,EMEs発生後の継続実行が可能であった. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10444176 | |||||||||
書誌情報 |
研究報告システムソフトウェアとオペレーティング・システム(OS) 巻 2025-OS-167, 号 7, p. 1-16, 発行日 2025-05-14 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8795 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |