Item type |
SIG Technical Reports(1) |
公開日 |
2021-03-18 |
タイトル |
|
|
タイトル |
FPGAシステムFlow-in-CloudにおけるTVMテンソルアクセラレータ (VTA) の実装 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Implementation of TVM a tensor accelerator (VTA) on the Flow-in-Cloud FPGA system |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
慶應義塾大学 |
著者所属 |
|
|
|
慶應義塾大学 |
著者所属 |
|
|
|
慶應義塾大学 |
著者所属(英) |
|
|
|
en |
|
|
Keio University |
著者所属(英) |
|
|
|
en |
|
|
Keio University |
著者所属(英) |
|
|
|
en |
|
|
Keio University |
著者名 |
弘中, 和衛
飯塚, 健介
天野, 英晴
|
著者名(英) |
Kazuei, Hironaka
Kensuke, Iizuka
Hideharu, Amano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
マルチ FPGA システム FiC (Flow-in-Cloud) は,Xilinx 社のミドルクラス FPGA Kintex Ultrascale と安価なシングルボード コンピュータ (SBC) である Raspberry Pi3B を搭載したノード同士を高速なシリアルリンクを用いて相互に直接結合して構成したシステムで,深層学習アプリ ケーショ ンなどを対象に,複数の FPGA にアプリケーションを分割して実装することで, 単一の FPGA では実装が難しい規模のアプリケーショ ンを実装可能とすることを目的としている. 一方で,深層学習のよう なドメインに特化したアーキテクチャ (DSA:Domain Specific Architecture) はこれまで数多く提案されており ,ドメインに特化した専用の命令セット (ISA) と演算ユニットを持つことで, 特定ドメインにおけるアプリケーションのプログラマビリティを向上しつつ, 処理を高速化できる.本稿では,OSS の AI 向け処理フレームワークである Apache TVM に着目し,その FPGA 向け DSA の実装である VTA (Versatile Tensor Accelerator) を FiC に実装し,TVM から FiC を利用可能とすることを目的とした予備評価を行なった.シングルノード の FiC-SW ボードを対象に VTA を実装し,TVM 付属の ResNet-18 の推論ベンチマークによる ARM Cortex-A54 と演算スループット を比較した.FiC-SW 上に実装した VTA は最大 10 倍の演算スループットを達成し,TVM から FiC を利用可能な見込みを得た. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10096105 |
書誌情報 |
研究報告システム・アーキテクチャ(ARC)
巻 2021-ARC-244,
号 42,
p. 1-6,
発行日 2021-03-18
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8574 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |