WEKO3
アイテム
マルチコアのためのコンパイラにおけるローカルメモリ管理手法
https://ipsj.ixsq.nii.ac.jp/records/61057
https://ipsj.ixsq.nii.ac.jp/records/610574c910abd-91f2-4b39-b312-3e9888221782
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-06 | |||||||
タイトル | ||||||||
タイトル | マルチコアのためのコンパイラにおけるローカルメモリ管理手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Local Memory Management Scheme by a Compiler for Multicore Processor | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院基幹理工学部情報理工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Waseda University | ||||||||
著者名 |
桃園, 拓
× 桃園, 拓
|
|||||||
著者名(英) |
Taku, Momozono
× Taku, Momozono
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 従来容量制限のあるローカルメモリ利用の最適化はプログラマにより手動で行われており,これは長時間を要する非常に困難な作業であったそこで,本稿ではマルチコア上で,プロセッサに近接した高速小容量のローカルメモリを自動並列化コンパイラにより自動的に有効活用する手法を提案する.本手法では,データローカリティと並列性を考慮してループ整合分割とタスクスケジューリングを行った後,スケジューリング結果を利用してローカルメモリ上のデータを長時間に渡り再利用できるようにデータ配置, DMA コントローラを用いたリプレースを行う.本自動ローカルメモリ管理手法の性能評価を, 32KB のローカルデータメモリと 64KB の分散共有メモリを搭載した SH4A を 8 コア集積した情報家電用マルチコアである RP2上で行ったところ,逐次実行に比べ, 8PE 時に MPEG2 エンコーダで約 6.20 倍, AAC エンコーダで約 7.25倍 , MiBench susan で約 7.64 倍の速度向上を自動で得ることに成功した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a local memory management scheme for an automatic parallelizing compiler to realize effective use of a limited size of local memory. After the loop aligned decomposition and task scheduling considering data locality and parallelism, the compiler allocates data to the local memory effectively using the task scheduling result. This paper evaluates the proposed scheme on RP2 multicore for consumer electronics which has 8 SH4A processor cores. Each core integrates 32KB of local data memory and 64KB of distributed shared memory. As the results, the proposed scheme using 8 processors gives us about 6.20 times speedup for MPEG2 encoding program, 7.25 times speedup for AAC encoding program and 7.64 times speedup for susan against the sequential execution. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
研究報告計算機アーキテクチャ(ARC) 巻 2009, 号 1(2009-ARC-181), p. 69-74, 発行日 2009-01-06 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |