WEKO3
アイテム
粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング
https://ipsj.ixsq.nii.ac.jp/records/23539
https://ipsj.ixsq.nii.ac.jp/records/23539834ed330-5f2d-4b20-a481-e6d4d743551a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-03-07 | |||||||
タイトル | ||||||||
タイトル | 粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An Analysis - time Procedure Inlining and Flexible Cloning Scheme for Coarse - grain Automatic Parallelizing Compilation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学部電気電子情報工学科 | ||||||||
著者所属 | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者所属 | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者所属 | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electrical, Electronics and Computer Engineering,School of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Advanced Parallelizing Compiler Project | ||||||||
著者名 |
熊澤慎也
× 熊澤慎也
|
|||||||
著者名(英) |
Shinya, Kumazawa
× Shinya, Kumazawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,粗粒度タスク並列性の更なる抽出を目的として,解析時のインライン展開,並列性解析,フレキシブルクローニングを組み合わせたプロシージャ間並列性解析手法を提案する.本手法は,解析を目的としてコンパイラ内部でインライン展開を施し並列性解析を行った後,解析された並列性を失わないように並列性のない部分を``フレキシブルクローニング''すなわちオリジナルソースあるいは別な形のサブルーチンに変換し,コード量の増加を抑える.この並列性解析手法により,生成コードの過度な増加を抑えつつグローバルな粗粒度タスク並列性を有効に引き出すことができる.SUN Ultra80 4プロセッサSMPワークステーション上でPerfect Club BenchmarkのARC2Dを用いて性能評価を行った結果,提案手法により,SUN Forteコンパイラの自動並列処理に比べて,本手法を適用しマルチグレイン並列化を行うことで4プロセッサ上で約15%のスピードアップが得られ,またコードサイズでもインライン展開のみを用いるとソースプログラムに対しオブジェクトコードで26.8%のコード量増大になるのに対し,フレキシブルクローニング手法を用いることで,コード増加量を14.8%に抑えられていることが確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes an interprocedural parallelism analysis scheme which combines analysis-time inline expansion and flexible cloning for coarse-grain parallelization. The analysis-time inlining is applied to selected subroutines. After the analysis of global parallelism over procedures, compiler generates inlined code for program part having global parallelism or applies ``flexible cloning'' to program parts without global parallelism into the original shape or different shape of subroutine. With this scheme, the compiler can exploit global coarse-grain with minimum increase in the code size. Performance evaluation using benchmark program ARC2D on SUN Ultra80 shows the proposed scheme gives us maximum 15% speedup than automatic parallelization of SUN Forte compiler. And by using flexible cloning, increase of code size has reduced by 14.8% from the case which doesn't use it. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2002, 号 22(2001-ARC-147), p. 191-196, 発行日 2002-03-07 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |