WEKO3
アイテム
並列システム性能の視覚的解析とその評価
https://ipsj.ixsq.nii.ac.jp/records/25897
https://ipsj.ixsq.nii.ac.jp/records/2589746058780-a0be-4cdf-bbe1-6889f6e5be79
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-03-04 | |||||||
タイトル | ||||||||
タイトル | 並列システム性能の視覚的解析とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance analysis of parallel computers and parallel programs using clock - level profiling system | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
お茶の水女子大学 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
新情報処理開発機構 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
物質工学工業技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ochanomizu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Materials and Chemical Research | ||||||||
著者名 |
益口摩紀
建部修見
佐藤三久
関口, 智嗣
長嶋, 雲兵
× 益口摩紀 建部修見 佐藤三久 関口, 智嗣 長嶋, 雲兵
|
|||||||
著者名(英) |
Maki, Masuguchi
Osamu, Tatebe
Mitsuhisa, Sato
Satoshi, Sekiguchi
Umpei, Nagashima
× Maki, Masuguchi Osamu, Tatebe Mitsuhisa, Sato Satoshi, Sekiguchi Umpei, Nagashima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では低コストかつ高精度なMPIプロファイリングツールを設計・構築し,実際に作成したツールを用いてアルファワークステーションクラスタetlwizの性能評価を行った.性能測定にはクロックカウンタを用いている.これにより,etlwizでは100 μsec.単位の精度が得られた.また大域時間を導入することで全プロセスのタイミングをはかることができ,並列システムの性能解析や通信オーバーヘッドの測定に役立つ.etlwizのブロッキング通信において,メッセージサイズを4KBとして受信が先に発行された状態で,送信が発行されてから受信が終了するまでの経過時間は394 μsec,その時のスループットは約10.14 MB/sであった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We develop a lightweight profiling tool for MPI programs using a clock counter of the CPU and precisely evaluate etlwiz, a dedicated cluster of Alpha WSs. This profiling system also supports a clock adjustment to generate a global clock in the order of 100 μsec on the etlwiz. Using the global clock, precise timings of whole parallel programs can be obtained, that can be helpful to measure performance of parallel machines and calculate communication overhead of parallel programs. In the case of blocking communication on the etlwiz, our profiling tool shows a 4 Kbyte latency of 394 μsec, from the beginning of MPI_Send() of a sender to the end of MPI_Recv() of a receiver under the condition that MPI_Recv() is issued in advance, and a throughput of 10.14 Mbyte/sec. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10444176 | |||||||
書誌情報 |
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) 巻 1999, 号 21(1998-OS-080), p. 73-78, 発行日 1999-03-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |