@article{oai:ipsj.ixsq.nii.ac.jp:00012672,
 author = {坂根, 広史 and 児玉, 祐悦 and 建部修見 and 小池, 汎平 and 山名, 早人 and 山口, 喜教 and 弓場, 敏嗣 and Hirofumi, Sakane and Yuetsu, Kodama and Osamu, Tatebe and Hanpei, Koike and Hayato, Yamane and Yoshinori, Yamaguchi and Toshitsugu, Yuba},
 issue = {5},
 journal = {情報処理学会論文誌},
 month = {May},
 note = {本論文では  分散メモリ型並列計算機において  同期・通信の支援機構が行列問題の並列処理性能に与える影響について議論し  それらが有効となる条件・要因を  モデルと実験によって定量的に明らかにする. LU分解法の代入部に現れる三角方程式の求解では  互いに依存性のない計算要素がイテレーション間にまたがっており  その並列性はウェーブフロント状に抽出できる. この問題を  並列性を自然に利用する細粒度アルゴリズムと  ブロック化による粗粒度アルゴリズムで表し  並列計算機EM-XとAP1000+に実装した. 最初に予備実験によって  これらの計算機が持つ同期・通信機構の特徴をパラメータによって表した. 次に  アルゴリズムの性質をモデル化し  通信オーバヘッドに起因する性能上限と  並列度の制限による有効PE台数を理論的に示した. 問題サイズが小さい場合  あるいは十分なPE台数が利用できる場合は  高い並列度が得られる細粒度アルゴリズムが有望である. ただし細粒度アルゴリズムで高い性能を得るには  通信起動のオーバヘッドが十分小さいことが必要であり  EM-Xがこの要件を満たす. 逆に  問題サイズが十分大きいか  比較的少ないPE台数しか与えられない場合は粗粒度アルゴリズムの方が良い. この場合は通信性能より逐次演算性能が重要となり  AP1000+が優位性を示す., In this paper, we discuss efficient parallel execution of a dense-matrix problem considering trade-offs between fine-grain and coarse-grain communication in distributed memory machines. The solution of the triangular system of equations involves data dependencies between consecutive iterations in the outer-loop. The dependencies can be naturally solved and processed in parallel by wavefront computation. Two ways of parallelizing are presented; the element-wise fine-grain approach and the coarse-grain approach. We implemented these algorithms on both EM-X and AP 1000+. Fine-grain support mechanisms of the EM-X had a great effect on the performance of the element-wise method for relatively small problem size, while employed RISC processors of the AP1000+ brought high performance of the coarse-grain method for larger size.},
 pages = {2281--2292},
 title = {ウェーブフロント型並列処理における分散メモリ型並列計算機の通信機構の評価},
 volume = {40},
 year = {1999}
}