@techreport{oai:ipsj.ixsq.nii.ac.jp:02009152, author = {杉崎,行優 and 高橋,大介}, issue = {5}, month = {May}, note = {近年の演算加速器には,低精度に特化した行列乗算ユニットが搭載されることが多い.この高い低精度行列演算性能を活かし,より高い精度での浮動小数点行列の乗算を高速に行う方式として,尾崎スキームIおよびIIが知られている.Fanら(2022)をはじめとする先行研究において,暗号などでの利用を想定し,尾崎スキームIに類似した方式による,剰余整数行列乗算の高速化が提案されている.一方で,尾崎スキームIIを基とした剰余整数行列乗算の高速化は提案されていない.本稿では,尾崎スキームIIを基とした剰余整数行列乗算をNVIDIA GPUのTensor Coreに向けて実装し,その性能を報告する.}, title = {尾崎スキームIIを利用した剰余整数行列乗算の高速化}, year = {2026} }