WEKO3
アイテム
細粒度通信機構を持つ並列計算機EM - Xにおける共有メモリプログラムの効率的実行
https://ipsj.ixsq.nii.ac.jp/records/17872
https://ipsj.ixsq.nii.ac.jp/records/17872c1e5d419-b914-460b-a4d5-bd0af25bcc56
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-11-15 | |||||||
タイトル | ||||||||
タイトル | 細粒度通信機構を持つ並列計算機EM - Xにおける共有メモリプログラムの効率的実行 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Execution Technique of Shared Memory Programs on Distributed Memory Parallel Computer EM - X Using Fine Grain Communication Mechanism | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 共有メモリ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
電子技術総合研究所情報アーキテクチャ部/電気通信大学大学院情報システム学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 | ||||||||
著者所属 | ||||||||
電子技術総合研究所情報アーキテクチャ部 | ||||||||
著者所属 | ||||||||
電子技術総合研究所情報アーキテクチャ部/筑波大学電子・情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Science Division, Electrotechnical Laboratory/Graduate School of Information Systems, The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Science Division, Electrotechnical Laboratory/Computer Science Division, Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者名 |
坂根, 広史
× 坂根, 広史
|
|||||||
著者名(英) |
Hirofumi, Sakane
× Hirofumi, Sakane
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 分散メモリ型並列計算機EM-Xは,グローバルポインタと細粒度通信によるリモートメモリアクセスを用いることにより,システム全体のメモリを分散共有メモリとして扱うことができる.共有メモリプログラムの実行において高速な通信起動とマルチスレッド実行によるレイテンシ隠蔽の効果を検証するため,ベンチマークプログラムをEM-X上で実行した.マルチスレッドの効果は見られたが,共有メモリアクセスの頻度が高いプログラムでは台数効果が限定的であった.この主な原因はマルチスレッド実行におけるスレッド切替えのオーバヘッドであることが分かった.次に,スレッド切替え抑制の観点から共有データのコピーをローカルメモリに置き,ソフトウェアにより一貫性を制御する機構を実装して改善を試みた.その結果,高頻度の共有アクセスを行うプログラムに対して注意深く最適化を施した場合に,マルチスレッドを併用したリモートメモリアクセスを用いる方式よりも高い性能が得られた.共有メモリアプリケーションを効率的に実行するためには,両方式のトレードオフを考慮し,アプリケーションに応じて適切な選択を行うことが重要であることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we discuss efficient parallel execution of shared memory programs on a physically distributed memory multiprocessor EM-X. The EM-X provides shared memory abstraction with a global address space and a remote memory access mechanism. For this approach, multithreading efficiently hides the latency caused by fine-grain communication, while the thread switching overhead still remains. To reduce the thread switching overhead and exploit locality of shared data, we have implemented a coherent local copy mechanism by software. Performance analyses show that a highly optimized implementation for a frequently shared access program greatly improves the performance, in spite of additional software overhead. We show that the tradeoffs between these two approach provide a basis for the selection of a technique that is more appropriate for efficient executions of various applications on the EM-X. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11560614 | |||||||
書誌情報 |
情報処理学会論文誌ハイパフォーマンスコンピューティングシステム(HPS) 巻 41, 号 SIG08(HPS2), p. 1-14, 発行日 2000-11-15 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |