WEKO3
アイテム
NVIDIA GPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法
https://ipsj.ixsq.nii.ac.jp/records/144611
https://ipsj.ixsq.nii.ac.jp/records/1446117c6d89b9-fc31-499d-9fd0-ce307b018a08
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2015-07-28 | |||||||||||
| タイトル | ||||||||||||
| タイトル | NVIDIA GPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 数値計算 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 理化学研究所計算科学研究機構 | ||||||||||||
| 著者所属 | ||||||||||||
| 理化学研究所計算科学研究機構 | ||||||||||||
| 著者所属 | ||||||||||||
| 筑波大学システム情報系 | ||||||||||||
| 著者名 |
椋木, 大地
× 椋木, 大地
× 今村, 俊幸
× 高橋, 大介
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | NVIDIA GPU のカーネルプログラムにおいてスレッド数の選択は性能に大きな影響を与えることが知られているが,最適なスレッド数を理論的に一意に決定する方法は明らかではない.本稿では性能がメモリ律速となる BLAS ルーチンである SAXPY,SGEMV,STRMV において,計算する問題サイズに対して最適なスレッド数を決定するための自動チューニング手法を検討した.提案手法は 2 つの自動チューニング機構で構成される.まず,ある問題サイズに対するカーネルのサンプリング実行から,デバイスおよびカーネル固有のチューニングパラメータを決定するオフライン自動チューニングを行う.そしてそれらのパラメータに基づいて,問題サイズに応じた最適なスレッド数を,ある性能モデルを用いてオンライン自動チューニングで決定する.評価実験では,3 つの NVIDIA GPU アーキテクチャ (Fermi,Kepler,Maxwell) において,スレッド数の選択がカーネルの性能に与える影響を示した上で,提案する手法によって多くの場合に最適なスレッド数を選択できることを示す. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10463942 | |||||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2015-HPC-150, 号 13, p. 1-13, 発行日 2015-07-28 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8841 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||