Item type |
SIG Technical Reports(1) |
公開日 |
2015-07-28 |
タイトル |
|
|
タイトル |
Zynqプラットフォームを利用したARM-EMAX密結合アクセラレータの評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of ARM-EMAX tightly coupled accelerator on Zynq |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
専用ハードウェア |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
著者名 |
竹内昌平
Tran, Thi Hong
高前田, 伸也
中島, 康彦
|
著者名(英) |
Shohei, Takeuchi
Thi, Hong Tran
Shinya, Takamaeda
Yasuhiko, Nakashima
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
我々はステンシル計算のデータ再利用性に着目し,内部に小規模なメモリを分散配置してデータを再利用するアレイ型アクセラレータ EMAX を以前に提案している.本稿では,EMAX の試作チップと ARM 混載 FPGA ボード Xilinx ZC706 を用いて,ホスト CPU と EMAX がメインメモリを共有する SOC を開発した.5 つのステンシル計算プログラムを用いて実行時間の測定を行い,アクセラレータを持つ SOC のボトルネックの解析を行った.その結果,外部メモリを介して EMAX に接続する従来型システムと比較して,最大で約 63.1 倍高い性能を達成することを確認したまた,ホスト CPU による前処理を削減することで,試作チップの周波数がホスト CPU に比べ 12 倍低いにも関わらず,ホスト CPU 単体の実行と比較して最大で約 1.2 倍高い性能を見積もった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We focused on the data reusability of stencil computations on a previous proposed array accelerator, named Energy-Aware Multimode Accelerator Extension (EMAX). EMAX uses a distributed memory network and a corresponding functional unit (FU) network to exploit data reusability in stencil computations. In this research, we implement a ARM hosted EMAX tigtly coupled accelerator on Xilinx ZC706 board. We evaluated the performance for the SoC with accelerator using five stencil application. EMAX achieves 63.lx performance improved from previous system that use external SDRAM. Additionally, by reducing the pre-processing of the host CPU, EMAX is estimated to have 1.2x performance of host CPU, despite the frequency of the EMAX is 12 times lower than ARM processor's frequency. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10096105 |
書誌情報 |
研究報告システム・アーキテクチャ(ARC)
巻 2015-ARC-216,
号 7,
p. 1-6,
発行日 2015-07-28
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8574 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |