@techreport{oai:ipsj.ixsq.nii.ac.jp:00190641,
 author = {鈴木, 順 and 林, 佑樹 and 荒木, 拓也 and 喜連川, 優 and Jun, Suzuki and Yuki, Hayashi and Takuya, Araki and Masaru, Kitsuregawa},
 issue = {16},
 month = {Jul},
 note = {Victream は著者らが [1] で提案した複数の GPU を用いた Out-of-Core 処理向けミドルウェアである.Out-of-Core 処理では GPU (Graphics Processing Unit) のメモリ容量より大きなデータを分割し,GPU とホストのメインメモリの間で入れ替えながら処理を行う.そのため GPU のデータ I / O が性能ボトルネックとなる.このボトルネックの緩和のため,Victream は GPU へのデータのプリフェッチと,GPUへのデータ I / O 量最小化を同時に実現する.そのため Victream スケジューラは動的でヒューリスティックなスケジューリング手法を採用している.しかし,ヒューリスティック手法は必ずしも最良のスケジュールを保証しない.そこで本稿では,与えられた計算に対して可能なスケジュールを Brute-Force シミュレーションで全探索し,得られた最良のスケジュールと Victream のスケジュールの計算時間を比較することで Victream の性能を評価する.結果,Victream は最良のスケジュールが実現する最短の計算時間ではないが,最短の計算時間に対する増加を 10% 以内に抑えた計算性能が実現できることがわかった.本稿ではさらに,Victream をホストと GPU を分離して計算プラットフォームの高い運用効率を実現する I / O デバイス分離のアーキテクチャに適用し,Victream の有効性を検証した.I / O デバイス分離のアーキテクチャでも性能ボトルネックはホストと GPU の間のデータ I / O となる.評価の結果,Victream は I / O デバイス分離のアーキテクチャで従来手法より効率的に GPU の演算リソースを使用でき,用いる GPU 数を増加させた場合も高い計算性能の向上が得られることがわかった.評価では,Victream は従来手法に対し最大 296% の性能向上を実現した.},
 title = {GPUミドルウェア”Victream”のシミュレーションによる性能評価},
 year = {2018}
}