@techreport{oai:ipsj.ixsq.nii.ac.jp:00187456, author = {中尾, 昌広 and 小田嶋, 哲哉 and 村井, 均 and 田渕, 晶大 and 藤田, 典久 and 塙, 敏博 and 朴, 泰祐 and 佐藤, 三久 and Masahiro, Nakao and Tetsuya, Odajima and Hitoshi, Murai and Akihiro, Tabuchi and Norihisa, Fujita and Toshihiro, Hanawa and Taisuke, Boku and Mitsuhisa, Sato}, issue = {9}, month = {Apr}, note = {アクセラレータを搭載したクラスタシステム (アクセラレータクラスタ) の性能を引き出すためには,アクセラレータ間の通信レイテンシを小さくすることが重要である.また,アクセラレータクラスタを簡易に利用できるプログラミング言語も求められている.本稿では,Tightly Coupled Accelerators (TCA)/ InfiniBand ハイブリット通信を用いたアクセラレータクラスタ用並列言語 XcalableACC (XACC) の評価を行う.TCA / InfiniBand ハイブリット通信とは,TCA が持つ低レイテンシ通信と InfiniBand が持つ高バンド幅を組合せた通信である.TCA / InfiniBand ハイブリット通信および XACC の有用性を調べるため,HPC 分野で重要なアプリケーションの 1 つである Lattice Quantum Chromo-Dynamics (LQCD) の実装を行い,64 計算ノードのアクセラレータクラスタ上で評価を行った.また,XACC との比較を行うために,CUDA と MPI (CUDA + MPI) および OpenACC と MPI (OpenACC + MPI) を用いた LQCD も実装した.まず性能評価を行った結果,TCA / InfiniBand ハイブリッド通信を用いた XACC の性能は,CUDA + MPI の性能よりも 9% 高く,OpenACC + MPI の性能よりも 18% 高いことがわかった.さらに,XACC に対して新しい拡張を行うことで,XACC の性能はさらに 7% 高くなることがわかった.次に生産性評価を行った結果,XACC は CUDA + MPI および OpenACC + MPI と比較して少ないコード量で実装を行えることがわかった.また,XACC は逐次コードのイメージを保ったまま並列化を行えるため可読性が高く,さらにポータビリティにも優れていることを示した.}, title = {Tightly Coupled Accelerators/InfiniBandハイブリッド通信を用いたアクセラレータクラスタ用並列言語XcalableACCの評価}, year = {2018} }