2024-03-29T09:36:37Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001446292023-04-27T10:00:04Z01164:02240:07894:08313
等間隔格子を用いたSPH粒子法プログラムのCUDAによる高速化Acceleration of Uniform Grid-based SPH Particle Method using CUDAjpn性能チューニングhttp://id.nii.ac.jp/1001/00144596/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=144629&item_no=1&attribute_id=1&file_no=1Copyright (c) 2015 by the Information Processing Society of Japan三重大学大学院工学研究科三重大学大学院工学研究科高田, 貴正大野, 和彦物理シミュレーション手法の一つである SPH 粒子法は,流体解析など様々な応用が可能であり,幅広い分野での利用が期待されている.一方で,規模の拡大や高精度化に伴い計算コストが膨大になるため,高速化の研究が行われている.近年では GPU を汎用計算に用いる GPGPU を利用して,標準的な CPU 以上の処理の高速化を実現している.GPU を用いた並列処理で高速な数値計算を行うためには,GPU アーキテクチャに合わせた低レベルなコーディングによる最適化が必要になる.しかし,最適化手法と GPU アーキテクチャの発展とともに,従来の並列化手法よりさらなる最適化の可能性が出てきた.そこで本研究では,CUDA を使用し,等間隔格子を用いた空間分割法の SPH 粒子法プログラムに,配列を用いたハッシュの格子データ構造を使用し,さらに,粒子データのソートおよび SoA(Structures Of Array) を適用することで,コアレッシングアクセスによるデータアクセスの効率化を図った.本手法と従来手法を用いたプログラムとの実行時間の比較を行った結果,従来手法より実行時間を短縮することができた.SPH particle method is widely used in various physical simulation fields such as fluid analysis. However, the demands for higher accuracy and larger problems increase the computation cost enormously. Thus the acceleration of the method have been studied. Recently, applying General Purpose computing on Graphics Processing Units (GPGPU) has achieved higher performance than using traditional CPU. High performance computing on GPU requires hand optimizations using low-level code considering the GPU hardware features. However, the recent advance on the GPU architecture and the optimization techniques enabled further improvement on implementing the method. We implemented SPH particle method using space partitioning based on an uniform grid. Increasing coalesced accesses on GPU largely reduces the memory access cost and improve the performance. For this purpose, we introduced an array-based hash grid data structure with particle sorting and AoS(Array of Structure) to SoA(Structure of Array) conversion. As the result of evaluation, our scheme improved the performance of SPH particle method.AN10463942研究報告ハイパフォーマンスコンピューティング(HPC)2015-HPC-15031162015-07-282188-88412015-07-24