WEKO3
アイテム
FMMを用いたペタスケール乱流解析
https://ipsj.ixsq.nii.ac.jp/records/79330
https://ipsj.ixsq.nii.ac.jp/records/79330cf14115b-4b5f-4b2d-b55a-9e56ac11712b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-11-21 | |||||||
タイトル | ||||||||
タイトル | FMMを用いたペタスケール乱流解析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Petascale Turbulence Simulation Using FMM | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | GPU最適化 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
KAUST | ||||||||
著者所属 | ||||||||
電気通信大学 | ||||||||
著者所属 | ||||||||
ボストン大学 | ||||||||
著者所属 | ||||||||
慶應義塾大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
King Abdullah University of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Boston University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Keio University | ||||||||
著者名 |
横田, 理央
× 横田, 理央
|
|||||||
著者名(英) |
Rio, Yokota
× Rio, Yokota
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Fast Multipole Method (FMM) は従来粒子のN体問題の高速化手法として発展してきたが,近年その応用の幅を広げる研究が多くなされている.本研究では,大規模 GPU システム向けに開発された FMM を用いて 20483 規模の乱流解析を行い,同様の計算条件のもとでスペクトル法との比較を行った.ただし,今回の解析に用いた手法は Treecode と FMM の長所を組み合わせたハイブリッド型になっており,GPU 上で高い Flops が出る treecode の特長をさらに高速なアルゴリズムである FMM で実現している.TSUBAME2.0 上で 4096 GPU を用いた計算において 74% の並列化効率を得た.また,このときの演算性能は 1.01PFlops であった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Fast multipole methods (FMM) were originally developed for accelerating N-body problems in astrophysics and other particle based methods. A recent trend in HPC has been to use FMMs in unconventional application areas. We have performed a 20483 turbulence calculation using an FMM designed for large scale GPU systems. The proposed method uses a hybridization of the treecode and FMM, and combines the data-parallel treecode with the O(N) FMM. The run on TSUBAME 2.0 using 4096 GPUs achieved 74 % parallel efficiency, and the sustained performance reached 1.01 PFlops. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2011-HPC-132, 号 29, p. 1-8, 発行日 2011-11-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |