@techreport{oai:ipsj.ixsq.nii.ac.jp:00218942, author = {山田, 芙夕楓 and 川上, 健太郎 and 栗原, 康志 and 松田, 一仁 and 田原, 司睦 and Fuyuka, Yamada and Kentaro, Kawakami and Kouji, Kurihara and Kazuhito, Matsuda and Tsuguchika, Tabaru}, issue = {4}, month = {Jul}, note = {Arm プロセッサ用の HPC 向け命令セットである SVE が開発され,スーパーコンピュータ「富岳」では,この命令セットを採用した Fujitsu Processor A64FX が使用されている.Python の数値演算ライブラリである NumPy は SVE に対応しておらず,A64FX の性能を十分に引き出せていない.そこで今回 NumPy を SVE 対応したので報告する.特に配列に対する超越関数の処理では,A64FX の性能を引き出すように ①SIMD 化と ②ループ 展開数の最適化の 2 つの工夫を行い,配列データに対する超越関数処理を 24 倍高速化した., SVE which is an instruction set for HPC for the Arm processor was developed, and the supercomputer Fugaku adopts Fujitsu Processor A64FX which adopted this instruction set. NumPy, the fundamental package for scientific computing with Python, does not support SVE and does not fully exploit the performance of the A64FX. Then, we added SVE implementations to NumPy, and we will report on it in this paper. In particular, in transcendental functions processing for the array, we made two improvements to bring out the performance of the A64FX. The first is SIMD, and the second is optimizing the number of loop unrolling. As a result, transcendental functions processing for array data was made 24 times faster.}, title = {NumPy超越関数処理のArm SVE向け最適化}, year = {2022} }