@techreport{oai:ipsj.ixsq.nii.ac.jp:00231066, author = {井町, 宏人 and 野崎, 愛 and Hiroto, Imachi and Ai, Nozaki}, issue = {27}, month = {Nov}, note = {ディープラーニング向けアクセラレータである MN-Core 上で倍精度の BLAS ルーチンを一部を除き実装し性能評価を行った.アクセラレータ内のデータ移動を最小化するデータレイアウトの考慮やレジスタ割り当ての最適化により,大部分のルーチンで実効効率が原理的な上限に漸近することを確認した.実装と性能評価の詳細を報告する., We implemented a part of double precision BLAS routines on MN-Core, an accelerator for deep learning, and evaluate their performance. Most of the implemented routines show efficiency approaching their upper limit after optimizing data layouts and register allocation to minimize data movement. Details of implementation and performance evaluation are reported.}, title = {MN-Coreアクセラレータ上でのBLASの実装と評価}, year = {2023} }