WEKO3
アイテム
EMAXVにおける複数バースト転送と複数ベクトル演算のオーバラップ手法
https://ipsj.ixsq.nii.ac.jp/records/172908
https://ipsj.ixsq.nii.ac.jp/records/1729085f60b793-af44-4b51-9ff5-abef2f1c8e42
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2016 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
ARC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2016-08-01 | |||||||
タイトル | ||||||||
タイトル | EMAXVにおける複数バースト転送と複数ベクトル演算のオーバラップ手法 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 計算効率 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者名 |
中島, 康彦
× 中島, 康彦
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,DSA (Domain-Specific Accelerator) に関する研究が盛んである [11].これまでに,LAPP [5] において,バイナリ互換と低次数ステンシル計算の高速化を両立する CGRA を開発し,EMAX2[8] において,高次数ステンシル計算の高速化と低電力化を図るために, メモリ内蔵 UNIT とリング接続による効率的なデータ再利用機構を導入した.さらに EMAX4[9] では,グラフ処理高速化のためにトランザクションユニットを導入した. しかし,最近の画像認識に使用する 16x16 畳み込み演算や離散ステンシル計算であるライトフィールド画像処理などに対応するには, ローカルメモリのさらなるスループット向上と効率的な演算オーバラップが必要である.本稿では,低速演算器と高速主記憶の組み合わせを最大限活用する EMAXV の考え方と見積り性能を示す.また,レジスタトランスファレベルシミュレータによる評価の結果,320x240 画像に対する 16x16 畳み込み演算,および,7Kx5K ライトフイールド画像処理 (距離計算) では,ARMv8 シングルスレッドに対して各々 10 および 33 倍,EMAX2 に対して後者は 17 倍の性能向上を期待できることを示す. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
研究報告システム・アーキテクチャ(ARC) 巻 2016-ARC-221, 号 12, p. 1-6, 発行日 2016-08-01 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8574 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |