@techreport{oai:ipsj.ixsq.nii.ac.jp:00223481, author = {福嶋, 泰優 and 飯塚, 健介 and 天野, 英晴}, issue = {6}, month = {Jan}, note = {我々の研究室では,M-KUBOS と呼ばれる価格性能比に優れた Zynq ボード複数枚から構成されるマルチ FPGA システムである,M-KUBOS クラスタを開発している.M-KUBOS クラスタは,5G モバイルネットワーク向けのマルチアクセスエッジコンピューティング(MEC)のサーバとしての利用が期待されており,近年需要が高まっている深層学習のように計算量,パラメータ数が膨大な処理を高性能,高電力効率で実行できることが求められる.深層学習の中でも,Vision Transformer(ViT)は,画像認識タスクにおいて畳み込み演算を用いずに高い認識精度を達成したことで注目されているが,その計算量とパラメータ数は非常に膨大であり,M-KUBOS クラスタで用いられているようなミドルエンドの FPGA 単体で高性能を達成することは困難である.そこで本研究では,M-KUBOS クラスタの FPGA 複数枚を用いて ViT の推論アクセラレータを実装した.ボード間パイプライン処理によって,使用する FPGA ボードの枚数に応じた線形的な性能向上を実現し,本実装は最大で 704GOPS の性能と 12.4GOPS/W の電力効率を達成した.}, title = {マルチFPGA上でのVision Transformerの並列実装}, year = {2023} }