Item type |
SIG Technical Reports(1) |
公開日 |
2016-12-14 |
タイトル |
|
|
タイトル |
Tofu2プロトコルオフロード機能を使ったMPI永続隣接集団操作のプロトタイプ実装と評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Prototype Implementation and Evaluation of an MPI Persistent Neighborhood Collective Operation Using Tofu2 Protocol Offlaoding Capability |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
計算と通信のオーバーラップ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
理化学研究所 |
著者所属 |
|
|
|
理化学研究所 |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者所属(英) |
|
|
|
en |
|
|
RIKEN |
著者名 |
畑中, 正行
小倉, 崇浩
高木, 将通
堀, 敦史
石川, 裕
|
著者名(英) |
Masayuki, Hatanaka
Takahiro, Ogura
Masamichi, Takagi
Atsushi, Hori
Yutaka, Ishikawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,FX100 Tofu2 インターコネクトに新しく導入された Session モードと呼ばれるプロコトル ・ オフロード機能を利用し,集団通信における計算と通信のオーバーラップを改善する手法を設計 ・ 実装する.本モードのコマンドキューでは,通常の FIFO ポインタに加え,通信スケジューリングを制御するためのセッション ・ オフセットと呼ばれるポインタが追加される.これを利用することで CPU の介在なしに Tofu2 インターコネクト側で通信の同期や契機が実現可能となる.集団通信のうち,MPI Forum によって策定中の MPI-4 版候補である永続集団通信の隣接集団操作を対象とする.一次元 3-point ステンシル計算の袖通信での評価結果,メッセージ長 16KiB で約 5 [us] のレイテンシが得られた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we design and implement an improvement method of overlap between computation and communication using a protocol offloading capability, called session mode, in the FX100's Tofu2 interconnect. In the session mode, in addition to FIFO read and write pointers in a normal command queue, an additional pointer, called a session offset, has been introduced in order to control scheduling of the queue. Using this feature, the basic building blocks of collective communications such as synchronization protocols and triggers of events can be implemented. One of the persistent neighborhood collective operations, proposed to the MPI-4 standard at the MPI Forum, is implemented using the Tofu2 session mode. The execution of a communication pattern exchanging ghost regions in one dimensional 3-point stencil computation is evaluated using the proposed method. It shows that our implementation achieves about 5 microseconds for data exchange of 16 KiB. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2016-HPC-157,
号 5,
p. 1-7,
発行日 2016-12-14
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |