WEKO3
アイテム
全点対最短経路問題を解くSeidelのアルゴリズムのTensor Coreを用いたCUDA実装
https://ipsj.ixsq.nii.ac.jp/records/217488
https://ipsj.ixsq.nii.ac.jp/records/217488758b4fb4-09a5-4828-99b7-7a97d2d32f42
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-03-10 | |||||||||
| タイトル | ||||||||||
| タイトル | 全点対最短経路問題を解くSeidelのアルゴリズムのTensor Coreを用いたCUDA実装 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | アクセラレータ | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 大阪府立大学 | ||||||||||
| 著者所属 | ||||||||||
| 大阪府立大学 | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Osaka Prefecture Uniersity | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Osaka Prefecture Uniersity | ||||||||||
| 著者名 |
竹内, 祐哉
× 竹内, 祐哉
× 藤本, 典幸
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 近年,深層学習が注目を集めている.深層学習の計算の中心は行列積和演算であるが,最近の GPU が備えている Tensor Coreは,これを半精度浮動小数点数で高速に実行できる.一方,行列積を用いて重みなし無向グラフを対称とした全点対最短経路問題を解く Seidel のアルゴリズムがある.本研究では,Seidel のアルゴリズムにおける行列積計算に Tensor Core を使うことで全点対最短経路問題が高速に解けることを示す.そして,この計算に半精度浮動小数点数を使うことによるオーバーフローの影響を議論する.NVIDIA A100 PCle 上で Tensor Core を使った GPU 実装では AMD Ryzen 5800X 上でマルチスレッド版 OpenBLAS と OpenMP を使った CPU 実装に比べて,頂点数 14336,次数 4096 の時,約 71.1 倍高速であった. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10463942 | |||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2022-HPC-183, 号 10, p. 1-7, 発行日 2022-03-10 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8841 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||