@techreport{oai:ipsj.ixsq.nii.ac.jp:00178607, author = {椋木, 大地 and 今村, 俊幸}, issue = {1}, month = {Apr}, note = {分散並列環境における行列積計算の通信削減手法として,2.5 次元アルゴリズムが提案されている.本稿では 2.5 次元アルゴリズムを使用した倍精度の分散並列行列積 (2.5 D-PDGEMM) を実装し,京コンピュータにおいてその性能を分析した.2.5 D-PDGEMM を利用するには行列データを 3 次元形状に分散する必要があるが,我々は 2.5 D-PDGEMM を従来型の 2 次元アルゴリズムを採用する PDGEMM の代用とすることを想定し,行列が 2 次元で分散されている状態に対して 2.5 次元アルゴリズムを実行する実装した.京コンピュータの 16384 ノード (131072 コア) を使用した性能評価では,ScaLAPACK の PDGEMM ルーチンを含む従来の 2 次元アルゴリズムによる実装と比べ,行列の再分散コストを考慮しても,我々の実装した 2.5 D-PDGEMM が高速となるケースがあり,2.5 次元アルゴリズムが PDGEMM の強スケーリング性を改善するために有効であることが確認された.}, title = {京コンピュータにおける2.5次元アルゴリズムを用いた分散並列行列積の実装と評価}, year = {2017} }