WEKO3
アイテム
データ再演法による並列プログラムデバッギング
https://ipsj.ixsq.nii.ac.jp/records/18385
https://ipsj.ixsq.nii.ac.jp/records/1838531128674-d478-4684-95a4-209d0fdfb9f9
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-08-15 | |||||||
| タイトル | ||||||||
| タイトル | データ再演法による並列プログラムデバッギング | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Parallel Program Debugging Based on Data-replay | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | プログラミングモデル・ツール | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 木更津工業高等専門学校 豊橋技術科学大学工学部 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学工学部 | ||||||||
| 著者所属 | ||||||||
| 豊橋技術科学大学工学部 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kisarazu National College of Technology,Toyohashi University of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Toyohashi University of Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Toyohashi University of Technology | ||||||||
| 著者名 |
丸山, 真佐夫
津邑公暁
中島, 浩
× 丸山, 真佐夫 津邑公暁 中島, 浩
|
|||||||
| 著者名(英) |
Masao, Maruyama
Tomoaki, Tsumura
Hiroshi, Nakashima
× Masao, Maruyama Tomoaki, Tsumura Hiroshi, Nakashima
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 並列プログラムのデバッギングの障害になる「実行の非決定性」を解決するために,実行中に発生するイベントの順序を保存,再現する「順序再演法」が広く用いられている.しかし順序再演法は,ロギングのオーバヘッドが小さいという特徴を持つ一方,再演時に全プロセスを動かさなくてはならない,各プロセスを自由な時点で停止させられないなどの制約がある.そこで我々は,順序ではなくイベントの内容自体を保存,再現することで決定的な再演を可能にする「データ再演法」を用いたデバッギングを提案する.データ再演法は,ロギングのオーバヘッド増加とひきかえに,各プロセスを単独で再演できる.また,「データ再演法」を巻き戻し実行と組み合わせることで,さらに強力なデバッギングシステムを実現できる.本稿では提案手法とMPI 上での実装,性能評価について述べる.並列計算機上での実験結果から,本手法が十分に現実的な速度(Nas Parallel Benchmarks でロギング実行は平均24%の速度低下,再演実行は38%の速度向上)とログサイズで動作することを示す. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Nondeterministic nature of parallel programs is the major difficulty in debugging. Orderreplay, a technique to solve this problem, is widely used because of its small overhead. It has, however, several serious drawbacks: all processes of the parallel program have to participate in replay even when some of them are clearly not involved with the bug; and the programmer cannot stop the process being debugged at an arbitrary point. We adopt another method for deterministric replay, data-replay, which logs contents of the events rather than their order, and makes it possible to run and stop each process independently. Data-replay is well able to cooperate with checkpointing/rollback mechanism. We applied the data-replay mechanism to MPI based parallel programs. The result of our experiment with Nas Parallel Benchmarks shows that our mechanism works at a practical cost. Logging communicated data incurs only 24% overhead while it accelerates replayed execution by 38% both in average. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11833852 | |||||||
| 書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 46, 号 SIG12(ACS11), p. 214-224, 発行日 2005-08-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7829 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||