WEKO3
アイテム
超並列計算機CP - PACSにおけるNPB Kernel CGの評価
https://ipsj.ixsq.nii.ac.jp/records/13052
https://ipsj.ixsq.nii.ac.jp/records/130524c748812-1c09-4baa-acf7-fee718f04410
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-06-15 | |||||||
タイトル | ||||||||
タイトル | 超並列計算機CP - PACSにおけるNPB Kernel CGの評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance Evaluation of NPB Kernel CG on CP - PACS (Special Issue on Parallel Processings) | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:並列処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 性能評価 | |||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
東京大学先端科学技術研究センター | ||||||||
著者所属 | ||||||||
明星大学情報学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Center for Advanced Science and Technology, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Computer Science, Meisei University | ||||||||
著者名 |
板倉, 憲一
× 板倉, 憲一
|
|||||||
著者名(英) |
Ken-Ichi, Itakura
× Ken-Ichi, Itakura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文ではNAS並列ベンチマークのKernel CGを用いて,超並列計算機CP?PACSの性能評価および解析を行い,CP?PACSにおける並列プログラムの最適化について述べる.Kernel CGでは,広範囲で複雑なデータ転送や短ベクトル処理が要求されるために並列化効率を上げることが難しいが,CP?PACSでは柔軟なハイパクロスバ網と擬似ベクトル処理機構によって最適化を行うことが可能である.評価に用いた並列プログラムは基本的な通信性能とCPU性能に基づいてFORTRANおよびアセンブラ・ソースでのチューニングを行い,CPU clock counterによる精密な実行時間測定を基に性能解析を行った.解析結果から通信時間とCPU処理時間の最適化にはトレードオフが生じるために,そのチューニングが必要であることが分かった.また,このような最適化を行うことで,他の並列計算機に対してCP?PACSが高い台数効果と絶対性能を持つことを示すことができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We evaluate the performance massively parallel processor CP-PACS on NAS Parallel Benchmarks Kernel CG.Since Kernel CG requires global data transfer and short vector processing,it is hard to achieve performance in proportion to the number of PU's.However,the pseudo vector processing mechanism implemented in each node processor can effectively handle short vector calculations.Moreover,Hyper-Crossbar Network,the interconnection network of CP-PACS,can provide high-performance global data communication.Owing to these characteristics,CP-PACS can achieve high absolute performance and speed-up ratio when increasing the number of PU's. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 39, 号 6, p. 1757-1765, 発行日 1998-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |