WEKO3
アイテム
統計的手法を用いた並列化コンパイラ協調マルチコアアーキテクチャシミュレータ高速化手法
https://ipsj.ixsq.nii.ac.jp/records/99396
https://ipsj.ixsq.nii.ac.jp/records/993967316fa70-487f-4536-97b2-41743630b575
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2014 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
EMB:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-03-08 | |||||||
タイトル | ||||||||
タイトル | 統計的手法を用いた並列化コンパイラ協調マルチコアアーキテクチャシミュレータ高速化手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Parallelizing Compiler Cooperative Acceleration Technique of Multicore Architecture Simulation using a Statistical Method | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | OS及びシステム開発 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Engineering, Waseda University | ||||||||
著者名 |
田口, 学豐
× 田口, 学豐
|
|||||||
著者名(英) |
Gakuho, Taguchi
× Gakuho, Taguchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,並列化コンパイラと協調しマルチコアアーキテクチャシミュレーションを高速化する手法を提案する.本手法では,まず実機での逐次実行のプロファイルを取得し,そのプロファイル結果を x-means 法でクラスタリングすることにより,評価対象アーキテクチャの詳細シミュレーションを行う箇所を特定する.さらに,クラスタリングの情報と評価対象マルチコアで実行するアプリケーションから,並列化コンパイラは精度切り替えコードを含む並列化コードを生成する.評価の結果,16 コアのシミュレーションを SPEC ベンチマークの equake において誤差 0.04%で 437 倍,MediaBench の MPEG2 エンコーダにおいて誤差 0.04%で 28 倍の速度向上をそれぞれ得ることが出来た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A parallelizing compiler cooperative acceleration technique for multicore architecture simulation is proposed in this paper. Profile data of a sequential execution of a target application on a real machine is decomposed into multiple clusters by x-means clustering. Then, sampling points for a detail simulation mode in each cluster are calculated. In addition, a parallelizing compiler generates a parallelized code by taking both of the clustering information and the source code of the target application. The evaluation results show, in the case of the simulation for 16 cores, 437 times speedup is achieved with 0.04% error for equake, and 28 times speedup is achieved with 0.04% error for mpeg2 encoder. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA12149313 | |||||||
書誌情報 |
研究報告組込みシステム(EMB) 巻 2014-EMB-32, 号 49, p. 1-6, 発行日 2014-03-08 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |