WEKO3
アイテム
gMLPを用いた画像認識向けDNNアクセラレータのFPGA実装
https://ipsj.ixsq.nii.ac.jp/records/214014
https://ipsj.ixsq.nii.ac.jp/records/214014c91d4296-2c9d-4514-9fac-95bd4e1434f2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
SLDM:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-11-24 | |||||||||
タイトル | ||||||||||
タイトル | gMLPを用いた画像認識向けDNNアクセラレータのFPGA実装 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 機械学習 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東京工業大学 | ||||||||||
著者所属 | ||||||||||
東京工業大学 | ||||||||||
著者名 |
神宮司, 明良
× 神宮司, 明良
× 中原, 啓貴
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Convolution を用いない画像認識の深層学習モデルである Vision Transformer が登場してから,CNN の代替として MLP ベースのモデルに大きな注目が集まっている.MLP ベースのモデルは,Convolution を持たないにもかかわらず,画像認識において高い認識精度を達成する.MLP-Mixer や gMLP などの MLP ベースモデルの研究では,よりシンプルな構造で高い認識精度を達成する.低レイテンシな推論は,処理単位あたりの計算データが小さいため GPU では計算効率が低下し,FPGA などの専用回路による設計が向いていると考えられる.本稿では,我々は MLP ベースモデルのための推論アクセラレータの FPGA 回路を提案する.MLP ベースのモデルでは MLP レイヤーにおける単純な行列積が計算の大部分を占めるため,提案回路において我々は行列積を高い並列度で効率的に計算することに注力する.我々はビット幅の広い GEMM と専用命令セットを設計し,2 つの大きな行列の積を 1 サイクルで計算する回路を設計した.本稿では,提案回路を Xilinx 社 ZCU102 FPGA ボード上に実装し,gMLP-S モデルの推論を実行した.ImageNet データセットを用いたクラス分類の実験結果によると,我々の実装は 74.5% の認識精度であり,159.0FPS と 6.3ms の推論速度であり,24.9W の消費電力だった.モバイル GPU と比較して,提案する実装は 4.4 倍高速であり,6.1 倍良い電力効率であった.CNN モデルを実装した既存 FPGA 実装と比較して,我々の実装は同等の推論速度でありながら,3% 以上高い認識精度であった. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11451459 | |||||||||
書誌情報 |
研究報告システムとLSIの設計技術(SLDM) 巻 2021-SLDM-196, 号 5, p. 1-6, 発行日 2021-11-24 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8639 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |