WEKO3
アイテム
メモリ依存予測を利用したフォワーディング局所化手法
https://ipsj.ixsq.nii.ac.jp/records/23287
https://ipsj.ixsq.nii.ac.jp/records/23287eaec8ac3-bfd2-4efb-b5c3-24f0e4eb5ce0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-07-30 | |||||||
タイトル | ||||||||
タイトル | メモリ依存予測を利用したフォワーディング局所化手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Memory Forwarding Localization Using Dependence Prediction | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科/科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, University of Tokyo/Japan Science and Technology Agency | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, University of Tokyo | ||||||||
著者名 |
入江, 英嗣
高田, 正法
坂井, 修一
× 入江, 英嗣 高田, 正法 坂井, 修一
|
|||||||
著者名(英) |
Hidetsugu, Irie
Masanori, Takada
Shuichi, Sakai
× Hidetsugu, Irie Masanori, Takada Shuichi, Sakai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 実行コアを複数の実行クラスタへ分割する“クラスタ型アーキテクチャ”は、広い実行幅と高クロック動作の両立を実現する方法として注目されている。クラスタ型アーキテクチャに関する様々な研究が行われている一方で、分散局所化の難しいメモリ参照処理がボトルネックとなることが指摘されている。各クラスタに小容量のD0キャッシュ(以下、D0)を設けるための手法はいくつか検討されているが、曖昧な依存関係や実行遅延予測のため、効果的な構成とすることが難しい。我々は既に、メモリ参照を分散局所化する手法として、メモリ依存予測を利用した“分散投機メモリフォワーディング”を提案している。本論文では、複数D0と分散投機メモリフォワーディングの比較評価を行い、それぞれの有効性を検討する。評価から、実行遅延予測失敗によりペナルティのため、プリミティブな複数D0が有効となるためには、大きなD0容量が必要な事が分かった。一方、分散投機メモリフォワーディングは適用率に限界があるものの、実行遅延予測失敗によるペナルティがないため、クラスタ内に小容量バッファしか利用できない場合に有効であることが分かった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Clustered Microarchitecture design which partitions its execution core into multiple execution clusters attract attention as the way to achieve wide and fast processing. While there are various studies on Clustered Microarchitectures are done, it is often pointed out that the cache access overheads limit its performance. To overcome this bottleneck, we have proposed the technique "Distributed Speculative Memory Forwarding" which uses memory dependence prediction and localize memory processing. In this paper, we estimate the proposed technique and the "Replicated Intra Cluster Cache", and compare their efficiency. Simulation results show that the scheduler replay caused by cache misses severely degrades performance of intra cluster cache. On the other hand, proposed technique shows good performance despite small buffer sizes. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2004, 号 80(2004-ARC-159), p. 49-54, 発行日 2004-07-30 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |