@techreport{oai:ipsj.ixsq.nii.ac.jp:00023370, author = {青木, 秀貴 and 高山, 恒一 and 中村, 友洋 and 松居, 昭宏 and 助川, 直伸 and Hidetaka, Aoki and Koichi, Takayama and Tomohiro, Nakamura and Akihiro, Matsui and Naonobu, Sukegawa}, issue = {119(2003-ARC-155)}, month = {Nov}, note = {POWER4+プロセッサによる8CPU超のSMPノードでは,各CPUがL2キャッシュミスを起こした際に発行するスヌープ要求同士の競合により,性能低下が発生する。このスヌープ競合の影響を評価した結果,スヌープ競合の発生しない8CPU構成と比べ,24CPU構成/32CPU構成ではアプリケーション実行時にそれぞれ平均20%/27%の性能低下を起こすのに対し,16CPU構成では平均10%の性能低下にとどまり,CPU数に対する高い性能スケーラビリティを実現できることがわかった。この結果に基づき,SR11000モデルH1のノードを16CPU構成とした。, In a POWER4+ SMP node of more than 8 CPUs, performance degradation can be caused by the conflict among snoop requests, which are issued when each data access misses L2 cache. The evaluation results show the average performance degradation by the snoop-request conflict is 10% in a 16-CPU node compared to a conflict-free 8-CPU node, while 20% in a 24-CPU node and 27% in a 32-CPU node each. In order to achieve good performance scalability to the number of CPUs, we decided the 16-CPU node of SR11000 model H1 on the basis of this result.}, title = {SR11000モデルH1のノード構成とスケーラビリティ評価}, year = {2003} }