@techreport{oai:ipsj.ixsq.nii.ac.jp:00176373,
 author = {塙, 敏博 and 中島, 研吾 and 大島, 聡史 and 星野, 哲也 and 伊田, 明弘 and Toshihiro, Hanawa and Kengo, Nakajima and Satoshi, Ohshima and Tetsuya, Hoshino and Akihiro, Ida},
 issue = {6},
 month = {Dec},
 note = {共役勾配法に代表されるクリロフ部分空間法の内積計算プロセスは,大規模並列システム上では性能低下の要因となる.Ghysels 等によって提案されたパイプライン型共役勾配法は,漸化式を使って本来のアルゴリズムを保ちつつ計算順序を変更したもので,MPI-3 でサポートされている非同期集団通信関数を適用することによって,集団通信と計算をオーバーラップさせ,従来手法と比較して高いスケーラビリティを得られることが知られている.本研究では,パイプライン型共役勾配法を使用した三次元有限要素法構造解析コードの Reedbush-U (東京大学情報基盤センター),Oakforest-PACS (最先端共同 HPC 基盤施設) における性能評価事例を紹介する., Significant communication overhead occurs during dot product operations in Krylov subspace methods, such as Conjugate Gradient Method (CG), on massively parallel supercomputers. Pipelined CG developed by Ghysels et al. applies recurrence relations on original CG algorithm. Although sequence of operations is different from that of original CG, algorithm of the pipelined CG is kept as that of original one. It is widely known that the pipelined CG with asynchronous collective communication supported in MPI-3 standard can hide overhead of collective communications by overlapping communications and computations. In the present work, performance evaluations of 3D finite-element applications for solid mechanics with pipelined CG on Reedbush-U (ITC, University of Tokyo), and Oakforest-PACS (JCAHPC) are demonstrated.},
 title = {パイプライン型共役勾配法の性能評価},
 year = {2016}
}