WEKO3
アイテム
ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法
https://ipsj.ixsq.nii.ac.jp/records/22937
https://ipsj.ixsq.nii.ac.jp/records/2293767e5b826-91ca-4b54-a6d4-fccbb189148d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-08-01 | |||||||
タイトル | ||||||||
タイトル | ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Hierarchical Coarse Grain Task Static Scheduling Scheme on a Heterogeneous Multicore | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, School of Fundamental Science and Engineering, Waseda University | ||||||||
著者名 |
和田, 康孝
× 和田, 康孝
|
|||||||
著者名(英) |
YASUTAKA, WADA
× YASUTAKA, WADA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法について述べる.ヘテロジニアスマルチコアは.1チップ上に汎用プロセッサに加え,動的再構成可能プロセッサ (DRP) や信号処理用プロセッサ (DSP) などのアクセラレータを複数集積したプロセッサで,低消費電力で高い処理性能を得ることができるアーキテクチャとして情報家電等の分野で注目を集めている.本稿で提案するスタティックスケジューリング手法は,ループやサブルーチン,基本ブロック間の並列性を利用する粗粒度タスク並列処理において,各タスクの特性,チップ上の各コアの種類を考慮して処理時間を最小とするようにタスクを汎用コア及びアクセラレータに割り当て,コア間でのデータ転送は DMR を用いてタスク処理とオーバーラップして行うことにより,プログラムの階層的な並列性とチップ上のアクセラレータを最大限利用する手法である.本手法をMP3エンコーダに適用し評価した結果,SH4A1コアのみを用いた場合に対して,SH4A4コア で3.97倍,SH4A2コアとDRP2コアで12.64 倍,SH4A4コアとDRP4コアを用いたときに24.48倍の速度向上を得られることが確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a static scheduling scheme for hierarchical coarse grain task parallel pro cessing on a heterogeneous multicore processor. A heterogeneous multicore processor integrates not only general purpose processors but also accelerators like dynamically reconfigurable proces sors (DRPs) or digital signal processors (DSPs). Effective usage of these accelerators allows us to get high performance and low power consumption at the same time. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics of each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using MP3 encoder. Hetero geneous configurations give us 12.64 times speedup with two SH4As and two DRPs and 24.48 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2007, 号 79(2007-ARC-174), p. 97-102, 発行日 2007-08-01 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |