@techreport{oai:ipsj.ixsq.nii.ac.jp:00225172, author = {長谷川, 健人 and 有馬, 海人 and 三輪, 忍 and 八巻, 隼人 and 本多, 弘樹}, issue = {28}, month = {Mar}, note = {並列アプリケーションの開発や性能チューニングに利用されるプロファイルは,通常は解析対象のアプリケーションを解析対象の計算環境で実行することにより取得する.プロファイリングに要するコスト(計算時間と計算資源)はアプリケーションの大規模化,複雑化にともなって増大するため,並列アプリケーション解析コストの削減はエクサスケール級のスーパーコンピューティングにおける重要な課題の一つである.本稿では,MPI 並列アプリケーションのキャッシュミス数を予測する手法を提案する.アプリケーションを実際に実行してプロファイルを取得するのは少ないコア数や小さな問題サイズに限定し,多いコア数や大きな問題サイズのプロファイルは上記のプロファイルから予測することで,大規模なプロファイルの取得に要するコストを削減する.TSUBAME3.0 上で NAS Parallel Benchmark と LULESH を用いて評価した結果,提案手法は 45.8%,47.1%,34.9% のコストでそれぞれ L1 データキャッシュ,L2 キャッシュ,L3 キャッシュのミス数を予測することができた.また,その際の予測誤差は,L1 データキャッシュと L2 キャッシュではそれぞれ 12.9% と 18.3% だったのに対し,L3 キャッシュではとても大きい値となってしまった.}, title = {並列アプリケーションのキャッシュミス数予測の評価}, year = {2023} }