@techreport{oai:ipsj.ixsq.nii.ac.jp:00144641, author = {小田嶋, 哲哉 and 朴, 泰祐 and 塙, 敏博 and 村井, 均 and 中尾, 昌広 and 田渕, 晶大 and 佐藤, 三久}, issue = {43}, month = {Jul}, note = {近年,HPC の分野では GPU を搭載したクラスタが広く利用されている.しかしながら,ノードを跨ぐ GPU 間の通信は,ホストメモリを経由して行うためレイテンシが増加し,特にアプリケーションの強スケーリングおける性能のボトルネックとなっている.筑波大学計算科学研究センターでは,ノード間の GPU 間を直接結合し,レイテンシ・バンド幅の改善を目的に密結合並列演算加速機構 TCA(Tightly Coupled Accelerators) を提案し,そのプロトタイプ実装として PCI Express に基づく PEACH2(PCI Express Adaptive Communication Hub version 2) システムを開発している.PEACH2 に基づく TCA システムでは,ハードウェア制限や実装効率の面で数十ノードを一組とするクラスタが限界であり,より大きな問題やサイズに対応するためにはこれらをさらに階層的に結合したシステムを構築し,それらを跨ぐ通信を行う必要がある.そこで我々は,PEACH2 と InfiniBand によるハイブリッド通信を提案している.しかし,ハイブリッド通信は,TCA と MPI の通信を混在させてプログラムを記述する必要があり,プログラミングが煩雑になる.そこで,アクセラレータ向けの並列言語である XcalableACC のフレームワークの中にハイブリッド通信を組み込むことで,低いプログラミングコストで通信ネットワークを有効に利用することを目指す.本稿では,姫野ベンチマークの袖領域交換の通信にこのシステムを適用し,評価を行う.その結果,PEACH2 と InfiniBand によるハイブリッド通信を用いた場合,InfiniBand のみの場合に比べ,最大 40%の性能向上が達成できた.同様に,集団通信である Broadcast,Allgather にハイブリッド通信を適用した結果,それぞれ最大で 21%,46%の速度向上が達成できた.これによって,ハイブリッド通信は TCA の適用範囲を拡大するだけでなく,TCA の低レイテンシ通信と InfiniBand の高バンド幅通信を組み合わせることによって,一般的な InfiniBand による通信に対して優位性があることが示された.}, title = {アクセラレータ向け並列プログラミング言語XcalableACCにおけるTCA/InfiniBandハイブリッド通信}, year = {2015} }