WEKO3
アイテム
入力サイズより出力サイズが十分小さい場合のGEMM演算のGPU上での実装
https://ipsj.ixsq.nii.ac.jp/records/174155
https://ipsj.ixsq.nii.ac.jp/records/17415535bce9f1-7d66-4352-94be-ca66cc14c678
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2016-08-01 | |||||||||
| タイトル | ||||||||||
| タイトル | 入力サイズより出力サイズが十分小さい場合のGEMM演算のGPU上での実装 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 行列計算 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 大阪府立大学大学院工学研究科 | ||||||||||
| 著者所属 | ||||||||||
| 大阪府立大学大学院工学研究科 | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Graduate School of Engineering, Osaka Prefecture University | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Graduate School of Engineering, Osaka Prefecture University | ||||||||||
| 著者名 |
服部, 大士
× 服部, 大士
× 藤本, 典幸
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | BLAS の GPU 向け実装に cuBLAS や MAGMA BLAS が存在する.それらの実装の GEMM ルーチンは与えられた行列のサイズに最適な内部ルーチンを呼び出すことによって多くの場合,理論最大性能に近い高速な計算を実現している.しかし,これらの実装では,サイズ m×k の行列と k×n の行列の GEMM 演算は m,n が小さい場合低速である.本論文では,転置を伴わない GEMM 演算において,k が特に大きく,m,n が小さい場合を対象とした実装手法を提案し,提案手法が既存手法より最大で 2 倍程度高速であることを示す. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10463942 | |||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2016-HPC-155, 号 41, p. 1-7, 発行日 2016-08-01 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8841 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||