2024-03-28T23:54:21Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001947862023-04-27T10:00:04Z01164:02240:09748:09749
GPUプログラムにおける静的参照関係を表すハイパーグラフの分割を用いた参照効率のよいデータ配置jpn最適化http://id.nii.ac.jp/1001/00194697/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=194786&item_no=1&attribute_id=1&file_no=1Copyright (c) 2019 by the Information Processing Society of Japan大阪大学基礎工学部大阪大学大学院情報科学研究科大阪大学大学院情報科学研究科大阪大学大学院情報科学研究科比嘉, 慎哉置田, 真生萩原, 兼一伊野, 文彦本報告では,GPU プログラムを対象に,メモリ参照効率化を目的としたデータ配置の最適化問題をヒューリスティックに解く手法を提案する.具体的には,グローバルメモリ上の領域を L1 キャッシュラインと同程度の大きさのチャンクに分割し,プログラムの静的なアクセスパターンを入力として,各スレッドブロックおよびワープがアクセスするチャンク数を最小化するデータ配置を求める.この問題をハイパーグラフの分割問題に変換し,それを効率的に解く分割アルゴリズムを提案する.評価実験の結果,連続アクセスの増大に特化したデータ配置と比較して,L1 キャッシュミス数を 70% に削減し,最大 1.28 倍の速度向上を達成した.分割に要する時間は,頂点数が 2000 万を越える大規模なハイパーグラフに対して 38 分であった.提案手法は,静的グラフ処理のように,不規則なアクセスパターンを含む GPU プログラムの高速化に有用である.AN10463942研究報告ハイパフォーマンスコンピューティング(HPC)2019-HPC-16815182019-02-262188-88412019-02-22