@techreport{oai:ipsj.ixsq.nii.ac.jp:00210015, author = {星野, 哲也 and 塙, 敏博}, issue = {17}, month = {Mar}, note = {A64FX はスパコン富岳に採用されたプロセッサであり,Scalable Vector Extension (SVE) を初めて実装したプロセッサであることから,その性能特性を明らかにすることは喫緊の課題である.本稿では,流体計算等で頻出するステンシル計算の中でも最も基本的な,三次元の拡散方程式のカーネルをベースとして一連の最適化を施す.特にその性能がアーキテクチャの特性に大きく依存する最適化であるテンポラルブロッキングを実装し,A64FX にて評価を行うことで,性能特性を明らかにするための試金石とする.一連の最適化を施した三次元拡散方程式のカーネルを Intel Xeon CascadeLake, Intel Xeon Phi Knights Landing, A64FX において比較評価することで,A64FX がそれらとは異なる性能特性を持っていることが明らかとなった.特にテンポラルブロッキング実装においては,Intel Xeon CascedeLake で良好な性能が得られた一方で,A64FX では性能向上を確認することができなかったが,その原因調査を通じて今後のプログラム開発において有益な知見を得ることができた.}, title = {A64FXにおけるテンポラルブロッキングの実装と性能評価}, year = {2021} }