WEKO3
アイテム
共有メモリマルチプロセッサの分散シミュレータShamanの設計と実装
https://ipsj.ixsq.nii.ac.jp/records/17819
https://ipsj.ixsq.nii.ac.jp/records/17819bc49d861-c212-43d8-9bfa-9eeb40173f65
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2003-01-15 | |||||||
| タイトル | ||||||||
| タイトル | 共有メモリマルチプロセッサの分散シミュレータShamanの設計と実装 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Design and Implementation of the Shaman Distributed Simulator of Shared Memory Multiprocessors | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | ソフトウェア分散共有メモリとその応用 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系/現在,株式会社富士通プライムソフトテクノロジ | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系/現在,セイコーエプソン株式会社 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学情報工学系 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computer and Information Sciences, Toyohashi University of Technology/Presently with Fujitsu Prime Software Technologies Ltd. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computer and Information Sciences, Toyohashi University of Technology/Presently with Seiko Epson Corporation | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computer and Information Sciences, Toyohashi University of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computer and Information Sciences, Toyohashi University of Technology | ||||||||
| 著者名 |
松尾, 治幸
今福, 茂
大野, 和彦
中島, 浩
× 松尾, 治幸 今福, 茂 大野, 和彦 中島, 浩
|
|||||||
| 著者名(英) |
Haruyuki, Matsuo
Shigeru, Imafuku
Kazuhiko, Ohno
Hiroshi, Nakashima
× Haruyuki, Matsuo Shigeru, Imafuku Kazuhiko, Ohno Hiroshi, Nakashima
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文は,我々が開発した共有メモリマルチプロセッサのための実行駆動型分散シミュレータShamanについて述べたものである.Shaman はフロントエンドとバックエンドから構成され,PC クラスタで実行される.フロントエンドは対象システムの命令レベルの動作を複数ノードを用いて並列にシミュレートし,単一ノード上のバックエンドでは対象システムのメモリ系のシミュレーションを行う.フロントエンドでのシミュレーション対象には共有メモリの論理的な挙動も含まれ,ソフトウェア分散共有メモリ(DSM )の技法により行うメモリ参照の履歴がバックエンドに送られて,メモリ系のシミュレーションに用いられる.Shaman の重要な特徴は,この参照履歴をDSM の技法とフロントエンドでのキャッシュの部分的シミュレーションを組み合わせた参照フィルタ操作により削減することにある.この手法と本論文で述べるシミュレータ特有のDSM 実装技法により,Shaman はきわめて高い性能を達成している.すなわち,16-way の対象マルチプロセッサにおけるSPLASH-2 カーネルの実行を16 台のフロントエンドノードを用いてシミュレートしたとき,1 秒間にシミュレートしたクロック数がLU 分解では335 × 10 6 ,FFT では392 × 10 6 となり,我々のシミュレーション手法の有効性が実証された. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper describes our distributed architectural simulator of shared memory multiprocessors named Shaman. The simulator runs on a PC cluster that consists of multiple front-end nodes to simulate the instruction level behavior of the target multiprocessor in parallel and a back-end node to simulate the target memory system. The front-end also simulates the logical behavior of the shared memory using software DSM technique and passes the memory references to drive the back-end. A remarkable feature of our simulator is the reference filtering to reduce the amount of the references utilizing the DSM mechanism and coherent cache simulation on the front-end. This technique and our sophisticated DSM implementation discussed in this paper give an extraordinary performance to the Shaman simulator. We achieved 335 million and 392 million simulation clock per second for LU decomposition and FFT in SPLASH-2 kernel benchmarks respectively, when we used 16 front-end nodes to simulate a 16-way target SMP. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11560614 | |||||||
| 書誌情報 |
情報処理学会論文誌ハイパフォーマンスコンピューティングシステム(HPS) 巻 44, 号 SIG01(HPS6), p. 114-127, 発行日 2003-01-15 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||