@techreport{oai:ipsj.ixsq.nii.ac.jp:00194786, author = {比嘉, 慎哉 and 置田, 真生 and 萩原, 兼一 and 伊野, 文彦}, issue = {15}, month = {Feb}, note = {本報告では,GPU プログラムを対象に,メモリ参照効率化を目的としたデータ配置の最適化問題をヒューリスティックに解く手法を提案する.具体的には,グローバルメモリ上の領域を L1 キャッシュラインと同程度の大きさのチャンクに分割し,プログラムの静的なアクセスパターンを入力として,各スレッドブロックおよびワープがアクセスするチャンク数を最小化するデータ配置を求める.この問題をハイパーグラフの分割問題に変換し,それを効率的に解く分割アルゴリズムを提案する.評価実験の結果,連続アクセスの増大に特化したデータ配置と比較して,L1 キャッシュミス数を 70% に削減し,最大 1.28 倍の速度向上を達成した.分割に要する時間は,頂点数が 2000 万を越える大規模なハイパーグラフに対して 38 分であった.提案手法は,静的グラフ処理のように,不規則なアクセスパターンを含む GPU プログラムの高速化に有用である.}, title = {GPUプログラムにおける静的参照関係を表すハイパーグラフの分割を用いた参照効率のよいデータ配置}, year = {2019} }