@techreport{oai:ipsj.ixsq.nii.ac.jp:00182788, author = {黒田, 明義 and 井上, 俊介 and 関澤, 龍一 and 南, 一生 and Akiyoshi, Kuroda and Shunsuke, Inoue and Ryuichi, Sekizawa and Kazuo, Minami}, issue = {27}, month = {Jul}, note = {近年 HPC システムの運用の現場で,様々な問題が報告されている.ジョブ実行時間の変動の問題は,要因が複雑に絡まり,原因の究明や解決が難しい問題の一つである.変動が大きいものの中には,ジョブが予定時間内に終了しない事例もあり,解析により,分散ファイルシステムでの I / O によるメタデータサーバ (MDS) の負荷が,性能限界まで達している事例があることが分かった.本報では,ノード単位で蓄積されている MDS 処理命令数のカウンタ情報を集約し,ジョブとの関係を解析するためのシステムを構築したので,その概要並びに解析事例を紹介する.本解析により,MDS 負荷が高いジョブの影響で,他のジョブが想定時間内に終了しない事例が見つかった.また小規模な並列数のジョブでも MDS 負荷が高いものがあることが分かった.MDS 負荷が高い状態では I / O 処理の一部が滞るため,過負荷状態の対策を行うことは,計算資源の無駄な消費の削減につながる.}, title = {「京」におけるジョブI/OによるローカルMDS負荷の分析}, year = {2017} }