@techreport{oai:ipsj.ixsq.nii.ac.jp:00234568,
 author = {松尾, 玲央馬 and 小泉, 透 and 入江, 英嗣 and 坂井, 修一 and 塩谷, 亮太},
 issue = {24},
 month = {Jun},
 note = {Graphic Processing Unit(GPU)はデータ並列性を利用することで高いスループットを実現するプロセッサである.その高いスループットを実現する機能の一つがマルチスレッド実行であり,一般に GPU は多くのスレッドを同時に実行することで様々なレイテンシを隠蔽する.そのため,スレッド内で遅延を隠蔽する高コストな out-of-order 実行は,GPU では一般に行われない.しかし,GPU のワークロードにおいても多くの命令レベル並列性が含まれており,out-of-order 実行によってこれを抽出することでさらに GPU の性能を向上させることができる.本研究では,GPU において非常に低コストな out-of-order 実行を実現する TURBULENCE アーキテクチャを提案する.TURBULENCE は,レジスタ番号ではなく命令間距離によってオペランドを指定する表現を導入した新しい ISA と,その新しい ISA を実行するマイクロアーキテクチャからなる.この距離に基づくオペランド表現を用いた命令では,命令間における偽の依存が生じない性質がある.この性質を利用し,本研究ではリネーム・ロジックやロード・ストア・キューなどの高コストな回路を導入せずに,GPU においてコスト効率の良い out-of-order 実行を実現する.シミュレーションによる評価の結果,TURBULENCEは ベースライン構成の GPU と比較して消費エネルギーを増加させることなく 23.7% 性能を向上させることができた.},
 title = {GPUにおける距離指定型命令セットを用いた軽量なアウトオブオーダー実行},
 year = {2024}
}