2024-03-28T18:13:45Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001266232023-11-17T02:17:36Z06504:08067:08073
分散プロセス環境下におけるソフトウェア回復方式の一提案A Software Failure Recovery Technique for Distibuted Processing Systemsjpnhttp://id.nii.ac.jp/1001/00126808/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=126623&item_no=1&attribute_id=1&file_no=1三菱電機(株)情報システム研究所三菱電機(株)情報システム研究所三菱電機(株)情報システム研究所野村, 立倉持, 和彦斎藤, 正史分散システムの高信頼化の-方法として、あるプロセスが故障した場合に他のプロセスがその途中結果を引き継いで処理を続行する方法(Check Point save/Roll Back)がある。現在、OSの仮想記憶機能を利用したCheck Point Save機能については様々な方法が提案されているが、それらは変更ページをCheck Point発生時に保存する、というものであり、その処理の間該当プロセスは停止させておかなければならないという問題がある。実時間性を要求するアプリケーションにおいては連続停止時間の長さに制限を設ける場合があり、このような方法は使用できない。またRoll Backについては、個々のプロセスが勝手にCheck Point Saveを実施するだけでは、メッセージが喪失しドミノ効果が発生する場合があるため、全プロセスのCheck Pointの組合せのうち、メッセージを喪失せず回復できる組合せ(Consistent Cut)を発見する必要がある。ここでは、変更ページの保存処理を分散ざせCheck Point発生時に起こるプロセスの停止を最小限に抑えるCheck Point Save方法と、各プロセスのメッセージ送受信を監視して最新のConsistent Cutを発見する方法を提案する。AN00349328全国大会講演論文集第49回ソフトウェア47481994-09-202015-01-20