@article{oai:ipsj.ixsq.nii.ac.jp:00017848, author = {片桐, 孝洋 and 黒田, 久泰 and 大澤, 清 and 工藤, 誠 and 金田, 康正 and Takahiro, Katagiri and Hisayasu, Kuroda and Kiyoshi, Ohsawa and Makoto, Kudoh and Yasumasa, Kanada}, issue = {SIG12(HPS4)}, journal = {情報処理学会論文誌ハイパフォーマンスコンピューティングシステム(HPS)}, month = {Nov}, note = {数値計算において高性能を達成するため,現在でも多くの技法を用いてチューニングがなされる.この作業自体が時間を浪費するものであったり,また利用する計算機に対する高度な知識が必要となる.本論文ではこのチューニング作業を自動化するため,並列数値計算ライブラリに自動チューニング機構を付加することを提案する.従来の機構との違いは,(1)分散メモリ型計算機を対象とする;(2)標準化された計算のみの最適化ではない;(3)ライブラリ全体の最適化が可能である;の3 点である.提案機構を付加した並列数値計算ライブラリILIB (Intelligent LIBrary )を,日立の分散メモリ型並列計算機HITACHI SR2201 ,HITACHI SR8000 で評価した.その結果,密行列LU 分解ルーチンでは理論性能に対して89%の効率,疎行列LU 分解ルーチンでは72%の効率という高い性能を達成した.また疎行列反復解法では,標準的にもちいられているパラメータに対する速度向上が52 倍にも及ぶことが明らかとなった.ブロック化アルゴリズムにおけるブロック幅といったような演算と通信に影響するパラメータも,ILIB では最適化可能である.このブロック幅の最適化の結果,2.3 倍の速度向上が得られる場合があった., To attain high performance in numerical computations,one has to tune one's programs by using several techniques.The tuning work is a time-consuming work,and it needs special knowledge of the target architectures.To automate the tuning work,we propose an auto-tuning facility for parallel numerical libraries in this paper.The different points between conventional facility and our facility are:(1)our facility focuses on distributed memory parallel machines;(2)our facility is not the limited optimization facility to standard computations; (3)our facility can optimize the all area of the target library.We evaluate the ILIB (Intelligent LIBrary)which contains the proposed auto-tuning facility on the HITACHI's distributed memory parallel machines of the HITACHI SR2201 and HITACHI SR8000.The evaluation shows that the ILIB can attain the efficiency of 89%in a dense LU decomposition routine and that of 72%in a sparse LU decomposition to theoretical peak performance.In the sparse iterative method routine,we obtained the speedup factor of 52 times in comparison with the execution time by the default parameters.On the other hand,the proposed facility can tune a block factor for blocked algorithm,which can affect computations and communications.For the optimization of the block factor,we found a case that the speed-up factor was 2.3 times.}, pages = {60--76}, title = {自動チューニング機構が並列数値計算ライブラリに及ぼす効果}, volume = {42}, year = {2001} }