WEKO3
アイテム
OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価
https://ipsj.ixsq.nii.ac.jp/records/23645
https://ipsj.ixsq.nii.ac.jp/records/236452deda2e9-3f0d-4c12-9dea-2b2915ebeab7
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-01-26 | |||||||
タイトル | ||||||||
タイトル | OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance Evaluation of the Compiler - directed Software DSM for OpenMP | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者名 |
佐藤, 茂久
× 佐藤, 茂久
|
|||||||
著者名(英) |
Shigehisa, Satoh
× Shigehisa, Satoh
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | OpenMP APIを用いた共有メモリ並列プログラムを、SMP PCを高速なネットワークで接続したSMPクラスタ上で透過的に実行するコンパイラ支援ソフトウェアDSMを研究・開発している。コンパイラが、共有データのノード間での一貫性を保証するためのコードをプログラム中に挿入すると共に、ソースレベルの解析に基づいて一貫性制御コードの最適化を行なうことを特徴とする。本稿では、OpenMP C版のNAS並列ベンチマークの中の、共役勾配法のプログラム(CG)を用いて、性能と最適化の効果を評価する。評価にはPentium II Xeonプロセッサを用いた4ウェイSMPを8台、Myrinetで接続したSMPクラスタを用いた。わずかなソースコードの修正と、手続き間解析や並列データフロー解析に基づいた最適化により、4ノード×2スレッドで、逐次実行の3.77倍の性能が得られた。しかし、それ以上の性能向上のためにはデータ配置の最適化が必要と思われる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We are developping a compiler-directed software DSM system that enables transparent execution of shared-memory parallel programs using OpneMP API on PC-based SMP clusters. The compiler inserts coherence control codes into a program and optimize them based on source-level analysis. In this paper, we present performance evaluation using OpenMP C version of the CG benchmark in the NAS Parallel Benchmarks. We evaluated performance using an SMP cluster consisting of Pentium II Xeon processors and Myrinet interconnection network. We obtained 3.77 times speedup for 4 nodes of 2-way SMPs with simple code modification and aggressive compiler optimizations based on interprocedural analysis and parallel dataflow analysis. However, it seems that optimizations for data placement is needed to obtain more performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2001, 号 10(2000-ARC-141), p. 7-12, 発行日 2001-01-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |