Item type |
SIG Technical Reports(1) |
公開日 |
2024-12-09 |
タイトル |
|
|
タイトル |
SCALE-DGのModal Filteringにおけるループボディ分割の自動チューニング |
タイトル |
|
|
言語 |
en |
|
タイトル |
Auto-tuning of Loop Body Splitting in Modal Filtering of SCALE-DG |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
自動最適化 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋大学大学院情報学研究科 |
著者所属 |
|
|
|
理化学研究所計算科学研究センター |
著者所属 |
|
|
|
理化学研究所計算科学研究センター |
著者所属 |
|
|
|
理化学研究所計算科学研究センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属 |
|
|
|
名古屋大学情報基盤センター |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, Nagoya University |
著者名 |
任, 軒正博
河合, 佑太
富田, 浩文
西澤, 誠也
片桐, 孝洋
星野, 哲也
河合, 直聡
永井, 亨
|
著者名(英) |
Xuanzhengbo, Ren
Yuta, Kawai
Hirofumi, Tomita
Seiya, Nishizawa
Takahiro, Katagiri
Tetsuya, Hoshino
Masatoshi, Kawai
Toru, Nagai
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
将来の高解像度大気シミュレーションを念頭において,不連続ガラーキン法を用いた高精度大気力学コア (SCALE-DG) を開発している.SCALE-DG の数値安定化ための modal filtering の実装において,展開多項式の次数 (P) が大きい場合に,ループボディ内の積和演算を分割し演算器律速を削減することによって,さらなる高速化が可能である.しかし,最適な分割数は P に依存する.本研究では,SCALE-DG の modal filtering において,異なる多項式次数に対応する最適なループボディ分割数を特定するチューニングプロセスを提案した.スーパーコンピュータ「不老」の Type I サブシステムを用い,次数 P を 3 から 11 まで設定してチューニングプロセスを行った.結果として,P≤7 の場合にはループボディを分割することより性能が劣化することが確認された.一方,8≤P≤11 の場合にはループボディを 3 分割するのが最適であり,最大でそれぞれ1.15,1.20,1.25,および 1.26 倍の高速化が達成された.また,ループボディを分割する際には,各分割の長さを可能な限り均等に分配することが最適であることも確認された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
SCALE-DG is a high-order fluid scheme developed for future high-resolution atmospheric simulations using the discontinuous Galerkin method (DGM). In the implementation of modal filtering for numerical stabilization in SCALE-DG, further acceleration is achievable by splitting the multiply-add operations in the loop body when the polynomial degree (P) is high, thereby reducing computational bottlenecks. However, the optimal number of splitting depends on the P. In this study, we proposed a tuning process for identifying the optimal number of loop body splitting for different polynomial degrees in modal filtering of SCALE-DG. The tuning process was executed from P = 3 to P = 11 on the supercomputer ”Flow” Type I subsystem. The results showed that the performance degraded with splitting the loop body when P ≤ 7. On the other hand, when 8 ≤ P ≤ 11, it was optimal to split the loop body into three parts, achieving speedups of up to 1.15, 1.20, 1.25, and 1.26 times, respectively. It was also confirmed that when dividing the loop body, it is optimal to distribute the length of each division as evenly as possible. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2024-HPC-197,
号 2,
p. 1-6,
発行日 2024-12-09
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |