2024-03-29T04:59:27Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000945702023-04-27T10:00:04Z01164:01579:07041:07232
OSCAR API標準解釈系を用いた階層グルーピング対応ハードウェアバリア同期機構の評価jpnハードウェアアクセラレーションhttp://id.nii.ac.jp/1001/00094551/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=94570&item_no=1&attribute_id=1&file_no=1Copyright (c) 2013 by the Information Processing Society of Japan早稲田大学早稲田大学早稲田大学早稲田大学早稲田大学川島慧大金羽木洋平林明宏木村啓二笠原博徳1 チップ内に搭載されるコア数の増加に伴い,アプリケーションからより多くの並列性を抽出し,低オーバーヘッドで利用することがこれらのコアを有効利用するために重要となっている.OSCAR コンパイラによる自動並列化ではより多くの並列性を利用するため,ループやサブルーチン内部の粗粒度並列性を解析し,階層的にタスク定義を行う.この階層的に定義されたタスクをコアを階層的にグルーピングし,コアグループに対して割り当てることにより並列処理を実現する.この階層的なグループ間で独立かつ低コストでバリア同期を実現できるハードウェアが提案され,SH4A プロセッサ 8 コア搭載の情報家電用マルチコア RP2 に実装されている.本稿では,OSCAR API 標準解釈系の階層グループバリア同期 API を RP2 のハードウェアバリア同期機構に対応し評価を行った結果について述べる.8 コアを使用した SPEC CPU 2000 の ART による評価ではソフトウェアでのバリア同期に対し 1.16 倍の性能向上が得られた.AN10096105研究報告計算機アーキテクチャ(ARC)2013-ARC-20616162013-07-242013-07-17