@techreport{oai:ipsj.ixsq.nii.ac.jp:00197509,
 author = {岡, 慶太郎 and 川上, 哲志 and 谷本, 輝夫 and 小野, 貴継 and 井上, 弘士},
 issue = {3},
 month = {Jun},
 note = {Graphic Processsing Unit （GPU） は多数のプロセッサコアによる並列処理により高性能を達成する．一方で，GPU は多数のプロセッサコアが少量の L1 キャッシュを共有するため，プログラムによっては競合性ミスが頻発する．この問題へのアプローチの一つとして面積を増加させることなくキャッシュの実効容量を増加させるデータ圧縮に基づくキャッシュメモリが挙げられる．しかしながら，既存手法はキャッシュライン圧縮効果が低い場合がある点や復元レイテンシが長くなりやすいため，GPU における性能向上が十分でない．そこで，本研究はまず，同一の静的命令が参照するキャッシュライン間ではデータ値の局所性が高い場合があるという性質を利用して，既存手法の圧縮効果を改善する．つぎに，我々は復元時に不必要なデータへのアクセスを抑制することで，復元レイテンシを削減する手法を提案する．評価の結果，全ての提案手法を包括的に適用した場合に従来型キャッシュに対して，平均 8.7 ポイントの性能向上を達成した．また，アプリケーションごとに適切な手法を選択する場合では従来型キャッシュと比較して平均 14.2 ポイントの性能向上を達成する可能性があることが明らかになった．},
 title = {データ圧縮に基づくGPU向け高性能キャッシュアーキテクチャの提案},
 year = {2019}
}