WEKO3
アイテム
並列計算機EM - 4におけるループ間Doacross方式の自動最適化
https://ipsj.ixsq.nii.ac.jp/records/24222
https://ipsj.ixsq.nii.ac.jp/records/242226e914cf7-5f10-49e1-864d-b5785491046f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1994 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1994-06-13 | |||||||
タイトル | ||||||||
タイトル | 並列計算機EM - 4におけるループ間Doacross方式の自動最適化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Tuning of Loop - Doacross Execution Scheme on the EM - 4 Multiprocessor | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
新情報処理開発機構 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Real World Computing Partnarship | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者名 |
山名, 早人
× 山名, 早人
|
|||||||
著者名(英) |
Hayato, Yamana
× Hayato, Yamana
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では,分散メモリ型の並列計算機において,イテレーション間にデータ依存があるループを高速実行するための手法として,ループ間Doacross方式を提案した.本方式は,通信ディレイ,リモートメモリライト・リード時間,及びデータ通信準備時間が全体の実行時間に与える影響を小さくする方式である.並列計算機EM-4を用いた評価の結果,Doacrossの1.8?3.6倍,Pipeliningの3.3?5.7倍,data owner computes ruleに基づく実行方式の1.8?3.6倍の処理速度向上を確認した.また,実行時間を最小にするためには,部分ブロック化係数kの決定が重要であることを示し,並列計算機が持つ各種パラメータとプログラム情報からコンパイル段階で決定できることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The purpose of this paper is to propose a new loop execution scheme, called Loop-Doacross, on distributed memory machines. A Loop-Doacross execution scheme shortens the total execution time by excluding the time of communication delay, remote memory writting&reading, and data sending preparation from the main execution stream. An experimental evaluation shows that the measured speedup ratio is 180%縲鰀570% of the the conventional execution schemes. This paper also describes its tuning scheme on the EM-4 multiprocessor at compile time. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 1994, 号 50(1994-ARC-106), p. 17-24, 発行日 1994-06-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |