2024-03-29T05:03:52Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000288212023-04-27T10:00:04Z01164:02240:02247:02252
マルチグレイン並列化コンパイラにおけるローカルメモリ管理手法A Local Memory Management Scheme in Multigrain Parallelizing Compilerjpnhttp://id.nii.ac.jp/1001/00028821/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=28821&item_no=1&attribute_id=1&file_no=1Copyright (c) 2007 by the Information Processing Society of Japan早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科早稲田大学理工学部コンピュータ・ネットワーク工学科三浦, 剛田川, 友博村松, 裕介池見, 明紀中川, 正洋中野, 啓史白子, 準木村, 啓二笠原, 博徳半導体集積度向上に伴うスケーラブルな性能向上,低消費電力,価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている.消費電力を抑えつつマルチコアプロセッサの実効性能を向上させ,アプリケーションソフトウェアの開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす.この実効性能の向上のためには,マルチコアプロセッサにおいても,プロセッサとメモリ動作速度のギャップに起因するメモリウォール問題への対処が必要となる.具体的には,プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために必須である.本稿では,OSCARマルチグレイン自動並列化コンパイラを用いた粗粒度タスク並列処理において,プログラム全域のデータローカリティを有効利用した,マルチコア上のローカルメモリ管理手法について提案する.SPEC 95fpのtomcatvを用いたOSCARマルチコアシミュレータ上の性能評価において,本手法未適用時の共有メモリを用いた逐次処理に対して,本手法適用によるローカルメモリ利用最適化により,8プロセッサで19.6倍の性能向上が得られた.Multicore systems have been attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. On multicore processor, a memory wall caused by the speed gap between processor core and memory is also serious problem. Therefore, it is important for performance improvement to use fast memolies like cache and local memory nearby a processor effectively. This paper proposes a local memory management scheme for coarse grain task parallel processing. In the evaluation using SPEC 95fp tomcatv, the proposed scheme using 8 processors achieved 19.6 times speedup against the sequantial execution without the proposed scheme on the OSCAR multicore processor by the effective use of local memories.AN10463942情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)200717(2007-HPC-109)61662007-03-012009-06-30