@article{oai:ipsj.ixsq.nii.ac.jp:00013052, author = {板倉, 憲一 and 松原, 正純 and 朴, 泰祐 and 中村, 宏 and 中澤, 喜三郎 and Ken-Ichi, Itakura and Masazumi, Matsubara and Taisuke, Boku and Hiroshi, Nakamura and Kisaburo, Nakazawa}, issue = {6}, journal = {情報処理学会論文誌}, month = {Jun}, note = {本論文ではNAS並列ベンチマークのKernel CGを用いて,超並列計算機CP?PACSの性能評価および解析を行い,CP?PACSにおける並列プログラムの最適化について述べる.Kernel CGでは,広範囲で複雑なデータ転送や短ベクトル処理が要求されるために並列化効率を上げることが難しいが,CP?PACSでは柔軟なハイパクロスバ網と擬似ベクトル処理機構によって最適化を行うことが可能である.評価に用いた並列プログラムは基本的な通信性能とCPU性能に基づいてFORTRANおよびアセンブラ・ソースでのチューニングを行い,CPU clock counterによる精密な実行時間測定を基に性能解析を行った.解析結果から通信時間とCPU処理時間の最適化にはトレードオフが生じるために,そのチューニングが必要であることが分かった.また,このような最適化を行うことで,他の並列計算機に対してCP?PACSが高い台数効果と絶対性能を持つことを示すことができた., We evaluate the performance massively parallel processor CP-PACS on NAS Parallel Benchmarks Kernel CG.Since Kernel CG requires global data transfer and short vector processing,it is hard to achieve performance in proportion to the number of PU's.However,the pseudo vector processing mechanism implemented in each node processor can effectively handle short vector calculations.Moreover,Hyper-Crossbar Network,the interconnection network of CP-PACS,can provide high-performance global data communication.Owing to these characteristics,CP-PACS can achieve high absolute performance and speed-up ratio when increasing the number of PU's.}, pages = {1757--1765}, title = {超並列計算機CP - PACSにおけるNPB Kernel CGの評価}, volume = {39}, year = {1998} }