@techreport{oai:ipsj.ixsq.nii.ac.jp:00217235, author = {空閑, 康太 and 高前田, 伸也}, issue = {15}, month = {Mar}, note = {畳み込みニューラルネットワーク (CNN) はコンピュータビジョンの分野で頻出である.近年は IoT デバイスの普及により組込みシステムでの需要も高い.FPGA 実装も多く試みられているが,CNN のパラメタ数は膨大なため,限られたリソース下ではパラメタをオフチップメモリに格納し,計算で必要となるたびに取得することがほとんどである.本稿では,量子化後のカーネルが類似することに着目し,畳み込み演算を組み合わせ回路として展開する,外部メモリアクセス不要なアーキテクチャについて検討を行った.また,このアーキテクチャに適した,クラスタリ ングと量子化を含む圧縮アルゴリズムを提案,評価し,精度と圧縮のトレードオフを明らかにした.}, title = {CNNのクラスタリングによる圧縮と推論アクセラレータの検討}, year = {2022} }