@techreport{oai:ipsj.ixsq.nii.ac.jp:00235605, author = {高田, 勝悟 and 中條, 拓伯}, issue = {8}, month = {Jul}, note = {近年 IoT やエッジ・デバイス上での AI タスクの処理が注目を集めている.このようなデバイスで AI タスクを動作させる際には,サイズや単純な整数演算で計算できるという観点から QNN の利用が進められており,このようなネットワーク形式をサポートする実装は数多く存在する.スレッドレベルの並列性も活用するために多くの実装でマルチコアアーキテクチャやクラスタが利用されるが,それぞれの演算器の利用率は低いことが予想される.本論文では,RISC-V Packed-SIMD 拡張を実装した新しい RISC-V SMT コア「B4SMT」を紹介する.また,単一の演算器でも,16 スレッド以上で効率的に動作し,メディアンフィルタで最大 100 倍,行列乗算で最大約 30 倍の高速化が可能であることを示す.}, title = {同時マルチスレッディングによるRISC-V Packed-SIMDの効率的な計算資源共有}, year = {2024} }