@techreport{oai:ipsj.ixsq.nii.ac.jp:00144637, author = {野瀬, 貴史 and 安島, 雄一郎 and 佐賀, 一繁 and 志田, 直之 and 住元, 真司 and Takafumi, Nose and Yuichiro, Ajima and Kazushige, Saga and Naoyuki, Shida and Shinji, Sumimoto}, issue = {39}, month = {Jul}, note = {ACE (Advanced Communication for Exa) プロジェクトでは,エクサスケールに向けて省メモリ・低遅延を両立する通信ライブラリ ACP (Advanced Communication Primitives) の開発に取り組んでおり,我々は ACP ライブラリの基礎となる ACP 基本層の Tofu インターコネクト 2 向けの性能チューニングを進めている.各種条件を変えながらリモート側不可分操作 1 回のレイテンシを評価した結果,スレッドセーフ時の最良値は 4.26 マイクロ秒,スレッドアンセーフ時の最良値は 3.68 マイクロ秒となった.さらなる最適化として,外乱抑制と将来の通信スレッド廃止に向けて通信スレッドの順序制御スレッドと委譲処理スレッドの 2 つに分割することも検討したが,ハードウェアの仕様に課題がある., In the ACE (Advanced Communication for Exa) Project, we are developing the ACP (Advanced Communication Primitives) library that satisfies both small memory consumption and low latency for the Exascale era. We are focusing on the performance tuning of the ACP Basic layer for the Tofu interconnect 2. We evaluated the latency of the atomic operation changing what optimizations are applied and achieved 4.26 microseconds under thread-safe condition and 3.68 microseconds under thread-unsafe condition. For further optimization, we investigated an effect of dividing a communication thread into a command ordering thread and a delegation thread. However, we found some problems on the specification of the hardware.}, title = {ACPライブラリの性能最適化に関する検討}, year = {2015} }