@techreport{oai:ipsj.ixsq.nii.ac.jp:00225428, author = {木村, 優之 and 塩谷, 亮太}, issue = {41}, month = {Mar}, note = {近年,汎用 CPU における性能向上のためにベクトル命令と呼ばれる命令が導入されている.ベクトル命令が汎用 CPU に導入されている主な理由は,プログラム中に存在する細粒度なデータ並列性を効率的に抽出するためである.そのような汎用 CPU では,実行される命令の大半はスカラ命令であり,それらを高速に実行するために out-of-order スーパスカラ・プロセッサが広く採用されている.しかし,out-of-order スーパスカラ・プロセッサにベクトル命令をそのまま実装すると,ベクトル命令が持つ複雑なレジスタやメモリ・アクセスの機能のために回路規模が爆発してしまう.我々は out-of-order スーパスカラ・プロセッサにおいて,ベクトル命令を軽量に実装する方法を提案する.提案手法は部分的にベクトル命令を in-order 実行する事により,大きな性能低下なくベクトル命令の実装に必要な回路を大幅に単純化することができる.提案手法をサイクル精度シミュレータに実装して予備評価を行ったところ,すべての命令を out-of-order 実行するナイーブな実装と比較して平均 12% の性能低下に抑えられることが確かめられた.}, title = {部分的なインオーダ実行の導入によるベクトル拡張命令の高効率な実装}, year = {2023} }