@techreport{oai:ipsj.ixsq.nii.ac.jp:00241700, author = {巽, 友佑 and 小泉, 透 and 津邑, 公暁}, issue = {7}, month = {Dec}, note = {近年の GPU は Unified Virtual Memory(UVM)と呼ばれる機能をサポートしており,GPU プログラミングの抽象度を高めている.一方で,UVM ではページ転送の前処理であるページフォルト処理(Page Fault Handling)がボトルネックとなることがある.このページフォルト処理によるオーバヘッドの影響を緩和するために,GPU では,複数のページフォルト処理を集約して処理する実行モデルが採用されている.また,Thread Block のコンテクストスイッチにより,集約して処理されるページフォルトの数を増やす手法なども提案されている.しかし,既存手法はいずれも,カーネルの起動直後に発生するページフォルトに対処できていない.そこで本稿では,レーンに割り当てられたスレッドが実行する命令を解析し,その解析結果に基づき積極的にスレッド同期を行うことでページフォルト処理の集約を促す手法を提案する.評価の結果,従来と比較して最大 13.4%,平均 4.1% の実行サイクル数の削減を確認した.}, title = {積極的なスレッド同期によるUVMのページフォルト処理集約手法}, year = {2024} }