WEKO3
アイテム
GPU上のTensor coreを使ったステンシル計算の時間ブロッキングによる高速化
https://ipsj.ixsq.nii.ac.jp/records/227140
https://ipsj.ixsq.nii.ac.jp/records/227140b7cd7d26-ee59-45fd-a203-3e442fb56f3a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年7月27日からダウンロード可能です。
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, HPC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-07-27 | |||||||||
タイトル | ||||||||||
タイトル | GPU上のTensor coreを使ったステンシル計算の時間ブロッキングによる高速化 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | アクセラレータ | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東京工業大学 | ||||||||||
著者所属 | ||||||||||
東京工業大学 | ||||||||||
著者名 |
神戸, 風太
× 神戸, 風太
× 遠藤, 敏夫
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 高性能計算においてシミュレーション等における微分方程式を近似するステンシル計算は重要な計算である.高速化手法としてタイムステップを数ステップ一度に進めることでメモリアクセスを減らす時間ブロッキングというものがある.また,最近のプロセッサには行列演算に特化した Tensor core 等のユニットが搭載されており,これをステンシル計算に応用した研究 TCStencil [1] が存在する.本論文では TCStencil [1] においてもう 1 段計算を追加することで時間ブロッキングを適用した実装を行った.計算を前に追加したものと後ろに追加したものの 2 種類を用意し,単純に GPU で実行したものや時間ブロッキングのみを行ったもの,元の Tensor core で 1 段のみのものと比較を行った.時間計測を行い,単純に GPU で実行した場合と比較して約 1.3 倍の高速化をすることができた.Tensor core を使った場合と比較しても時間ブロッキングの寄与によって約 1.05 倍の高速化ができた. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10463942 | |||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2023-HPC-190, 号 29, p. 1-6, 発行日 2023-07-27 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8841 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |