| Item type |
SIG Technical Reports(1) |
| 公開日 |
2019-02-26 |
| タイトル |
|
|
タイトル |
計算ノードの使用効率向上を目指した「京」のファイルシステムの運用改善 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ファイルシステム |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者所属 |
|
|
|
理化学研究所計算科学研究センター |
| 著者所属 |
|
|
|
理化学研究所計算科学研究センター |
| 著者所属 |
|
|
|
理化学研究所計算科学研究センター |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者所属 |
|
|
|
(株)富士通ソーシアルサイエンスラボラトリ |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者名 |
古谷, 吉隆
辻田, 祐一
山本, 啓二
宇野, 篤也
末安, 史親
肥田, 元
岡本, 光央
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
スーパーコンピュータ 「京」 (以下,「京」 ) の計算ノードの使用効率向上を目指して,我々はファイルシステムの運用改善に取り組んでいる.「京」 では Lustre をベースとしたファイルシステムを採用しており,8 万台を超える計算ノードが 1 つのファイルシステムに接続されている.多数のクライアントが同一ディレクトリへのファイルアクセスを行うと,ファイルシステムの処理効率が著しく低下する.処理効率が低下すると,経過時間を超過したジョブの削除措置が,ファイルシステムの問題で適切に処理されない.その間計算ノード群は利用できないため,現状では制限時間内にジョブの削除が完了しない場合,その計算ノードを停止させて処理を完了させている.ジョブ削除やノード復旧の待ち合わせで計算ノードの使用効率が低下するため,更なる改善が求められる.本稿では,このような使用効率を低下させる問題に対して,Lustre が有するクライアント追放機能 (evict) に着目し,I / O リクエストを中断させることでノード時間積の損失を低減させる方法を提案する.「京」 の 6 万台の計算ノードを用いて評価を行い,提案手法の有効性を確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2019-HPC-168,
号 21,
p. 1-5,
発行日 2019-02-26
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |