| Item type |
SIG Technical Reports(1) |
| 公開日 |
2022-07-20 |
| タイトル |
|
|
タイトル |
多相CFDシミュレーションにおける悪条件行列に対するGPU向けBFloat16精度前処理の検証 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
CFD |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
日本原子力研究開発機構システム計算科学センター |
| 著者所属 |
|
|
|
日本原子力研究開発機構システム計算科学センター |
| 著者所属 |
|
|
|
理化学研究所計算科学研究センター |
| 著者所属 |
|
|
|
日本原子力研究開発機構システム計算科学センター |
| 著者所属 |
|
|
|
日本原子力研究開発機構システム計算科学センター |
| 著者名 |
伊奈, 拓也
井戸村, 泰宏
今村, 俊幸
山下, 晋
小野寺, 直幸
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
「富岳」や「Summit」をはじめとする最先端スーパーコンピュータでは倍精度演算性能よりも低精度演算性能の方が数倍高く,FP16 や Bfloat16 を活用した混合精度処理が有効である.しかし,多相CFD シミュレーションの悪条件行列に対する反復解法に低精度演算をそのまま適用すると収束性の悪化を引き起こす問題がある.これまで,多相熱流動解析コード JUPITER を対象としてクリロフ部分空間法の混合精度前処理を構築し,A64FX では行列のスケーリングと FP16 データ/FP32 演算混合精度前処理により収束性の維持と高速化を実現した.本研究では,NVIDIA GPU でサポートされている BFloat16 を用いて混合精度前処理の検証を行った.Bfloat16 は FP32 と同等なダイナミックレンジを持つため FP16 では必須であるオーバーフローを防ぐためのスケーリングは不要である.その結果,Bfloat16 を用いることで FP16 を使用した場合と比較して前処理で 7% の高速化を確認した.しかし,仮数部のビット数が FP16 よりも少ない Bfloat16 では収束性が悪化するケースも見られた. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2022-HPC-185,
号 26,
p. 1-6,
発行日 2022-07-20
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |