@techreport{oai:ipsj.ixsq.nii.ac.jp:00146520, author = {関澤, 龍一 and 宇野, 篤也 and 山本, 啓二 and 若林, 大輔 and 肥田, 元 and 池田, 直樹}, issue = {3}, month = {Dec}, note = {スーパーコンピュータや PC クラスタといった HPC システムでは,高並列化に伴う構成部品数の増加によりシステムの故障率が増加傾向にある.通常,計算ノードの故障がそのままシステムの運用停止につながるようなことはほとんど起きないが,故障ノード数が増加すると運用への影響は無視できないものとなる.故障ノードが発生する毎に保守を行うことで運用への影響を最小限にすることができるが,頻繁な保守作業は運用コストの面から困難である.本稿では,故障ノードの発生が運用に及ぼす影響を最小限にできる保守タイミングについて検討を行った.今回,故障ノードの発生が運用に及ぼす影響としてジョブスケジューリングに着目し評価を行ったので,その結果について報告する.}, title = {ノード故障によるジョブスケジューリングへの影響評価}, year = {2015} }