@techreport{oai:ipsj.ixsq.nii.ac.jp:00219011, author = {赤部, 知也 and 中島, 康彦}, issue = {22}, month = {Jul}, note = {ARM プロセッサをホストとし,AXI インタフェースにより接続される CGRA 型アクセラレータ IMAX2は,AXI トランザクションを使用した IMAX2 のローカルメモリと ARM の主記憶間の DMA に要する時間がボトルネックであった.そこで,DMA の 8 チャネル化と AXI インターフェイスをフルに活用するための IMAX2 のタンデム化を行った.事前転置をしない 7200×7200 の行列積による評価の結果,タンデム化していないユニット数が同じ IMAX2 に対して,ローカルメモリに ARM の主記憶から入力データを書き込む時間は約 45%,全体時間は約 20% の削減を確認した.}, title = {主記憶帯域使用率向上のためのCGRA タンデム化}, year = {2022} }