Item type |
Symposium(1) |
公開日 |
2015-05-12 |
タイトル |
|
|
タイトル |
ステンシル計算におけるスペアノードを用いた故障復帰における通信性能への影響について |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Study of Communication Performance When Using Spare Nodes to Replace Failed Nodes |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
通信 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
独立行政法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
独立行政法人理化学研究所計算科学研究機構 |
著者所属 |
|
|
|
独立行政法人理化学研究所計算科学研究機構 |
著者所属(英) |
|
|
|
en |
|
|
RIKEN AICS |
著者所属(英) |
|
|
|
en |
|
|
RIKEN AICS |
著者所属(英) |
|
|
|
en |
|
|
RIKEN AICS |
著者名 |
吉永, 一美
堀, 敦史
石川, 裕
|
著者名(英) |
Kazumi, Yoshinaga
Atsuhi, Hori
Yutaka, Ishikawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
エクサの時代が近づくにつれ,耐故障性の研究の重要性が高まっている.本論文では,メッシュ/トーラスネットワークトポロジーにおいて,ステンシル計算を対象に,ノード故障から復帰するためにスペアノードをどのように割り当て,故障ノードをどのように代替すべきか,という点について研究した結果を報告する.ステンシル計算においては,故障ノードに割り当てられたサブタスクを他の正常なノードに配分する方式は不適切であることを示し,スペアノードによる代替方式を提案する.この時,スペアノードに代替させることで通信メッセージの衝突が発生し,通信遅延時間が増大する可能性があることを示す.本稿では 3 種のスペアノード置換手法を提案し,主にこのメッセージ衝突数という尺度で評価し,それぞれの手法の特徴を明らかにする.結果として,これら 3 つの手法を組み合わせるのが最適と考える. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Towards Exa-scale computing era, the need of fault tolerance research is getting higher and higher. In this paper, how spare nodes should be allocated for stencil programs to replace faulty nodes is investigated. Firstly, it is shown that the way for stencil programs to distribute the workload allocated to the faulty node is not suitable. Then, three methods of how faulty nodes should be replaced by spare nodes are proposed. By using spare nodes, there is a possibility of having communication message collisions, and thus, communication latency can be increased. The three methods are investigated and compared with this maximum number of message collisions to reveal thier characteristics. As a result, the combination of these three methods is considered to be the best. |
書誌情報 |
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集
巻 2015,
p. 9-16,
発行日 2015-05-12
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |