@techreport{oai:ipsj.ixsq.nii.ac.jp:00023340, author = {笠原, 寛壽 and 清水, 雄歩 and 津邑公暁 and 中島, 康彦 and 五島, 正裕 and 森, 眞一郎 and 富田, 眞治 and Hirohisa, Kasahara and Yuho, Shimizu and Tomoaki, Tsumura and Yasuhiko, Nakashima and Masahiro, Goshima and Shin-Ichiro, Mori and Shinji, Tomita}, issue = {20(2003-ARC-157)}, month = {Mar}, note = {再利用を用いた並列事前実行機構において使用される再利用表を,現実的な幅を持つCAMにより構成してきた.しかしながら,CAM自体の検索回数が増加しオーバーヘッドが大きくなるため,再利用の実行によりプログラムが性能低下する場合が存在する.本稿では,再利用表検索にかかるコストを評価する機構を追加し,この問題を解決する.予備実行との比較評価を行った結果,CAMに長レイテンシを仮定した場合においても,Stanfordでは予備実行の1%に対して約20?30%,SPEC95では4%に対し7?10%という,良好な平均サイクル数削減率が得られた.また,共有2次キャッシュを仮定し,再利用機構が効果的なプリフェッチ機構としても作用することを示した., We have implemented reuse buffer for region reuse with general-perpose CAM. However, the times of reference to CAM increase.Since reuse cost becomes large, a program may carry out a performance fall by execution of reuse. This paper proposes a structure which estimates the cost concerning reuse buffer reference. We show the average ratio of eliminated cycles ranges from about 20% to 30% with Stanford benchmark, and from 7% to 10% with SPEC95 benchmark. These results are better than the one with pre-execution: 1% with Stanford and 4% with SPEC95. We also show that reuse structure with second level cache functions well as a structure for pre-fetching.}, title = {2次キャッシュを用いた再利用および並列事前実行機構における高速化手法}, year = {2004} }