WEKO3
アイテム
MPI_Allreduceの「京」上での実装と評価
https://ipsj.ixsq.nii.ac.jp/records/86065
https://ipsj.ixsq.nii.ac.jp/records/8606539d93807-31ca-4176-a2c1-65a375dfede0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-10-15 | |||||||
タイトル | ||||||||
タイトル | MPI_Allreduceの「京」上での実装と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Implementation and Evaluation of MPI_Allreduce on the K Computer | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [高性能計算] 京コンピュータ,MPI集団通信,MPI_Allreduce,トーラスネットワーク | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
九州大学 | ||||||||
著者所属 | ||||||||
九州大学 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属 | ||||||||
理化学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN, AICS | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN, AICS | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN, AICS | ||||||||
著者所属(英) | ||||||||
en | ||||||||
RIKEN, AICS | ||||||||
著者名 |
松本, 幸
安達, 知也
住元, 真司
南里, 豪志
曽我, 武史
宇野, 篤也
黒川, 原佳
庄司, 文由
横川, 三津夫
× 松本, 幸 安達, 知也 住元, 真司 南里, 豪志 曽我, 武史 宇野, 篤也 黒川, 原佳 庄司, 文由 横川, 三津夫
|
|||||||
著者名(英) |
Yuki, Matsumoto
Tomoya, Adachi
Shinji, Sumimoto
Takeshi, Nanri
Takeshi, Soga
Atsuya, Uno
Motoyoshi, Kurokawa
Fumiyoshi, Shoji
Mitsuo, Yokokawa
× Yuki, Matsumoto Tomoya, Adachi Shinji, Sumimoto Takeshi, Nanri Takeshi, Soga Atsuya, Uno Motoyoshi, Kurokawa Fumiyoshi, Shoji Mitsuo, Yokokawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では, 82,944 台の計算ノードを Tofu インターコネクトと呼ばれる 6 次元の直接網で結合した 「京」 における MPI 集団通信の高速化について述べる.従来の MPI ライブラリには,トポロジを考慮したアルゴリズムが存在しないため, 「京」 のような直接網において性能を出すことができない.そのため, Trinaryx3 と呼ばれる Allreduce を設計し, 「京」 向けの MPI ライブラリに実装した. Trinaryx3 アルゴリズムは,トーラス向けに最適化されており, 「京」 の特長の 1 つである複数 RDMA エンジンを活用することができる.実装を評価した結果,既存のトポロジを考慮していないアルゴリズムと比較して, 5 倍のバンド幅の向上を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper reports a method of speeding up MPI collective communication on the K computer, which consists of 82,944 computing nodes connected by a 6D direct network, named Tofu interconnect. Existing MPI libraries, however, do not have topology-aware algorithms which perform well on such a direct network. Thus, an Allreduce collective algorithm, named Trinaryx3, is designed and implemented in the MPI library for the K computer. The algorithm is optimized for a torus network and enables utilizing multiple RDMA engines, one of the strengths of the K computer. The evaluation results show the new implementation achieves five times higher bandwidth than existing one. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 5, 号 5, p. 152-162, 発行日 2012-10-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |