WEKO3
アイテム
複数のGPU向けプログラミングモデルを用いた倍々精度疎行列ベクトル積の特性分析
https://ipsj.ixsq.nii.ac.jp/records/229549
https://ipsj.ixsq.nii.ac.jp/records/229549e00c6d9e-74e0-4c44-9056-0c11c5bc0037
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-16 | |||||||||||||||
| タイトル | ||||||||||||||||
| タイトル | 複数のGPU向けプログラミングモデルを用いた倍々精度疎行列ベクトル積の特性分析 | |||||||||||||||
| 言語 | ||||||||||||||||
| 言語 | jpn | |||||||||||||||
| キーワード | ||||||||||||||||
| 主題Scheme | Other | |||||||||||||||
| 主題 | コンピュータシステム | |||||||||||||||
| 資源タイプ | ||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
| 資源タイプ | conference paper | |||||||||||||||
| 著者所属 | ||||||||||||||||
| 工学院大 | ||||||||||||||||
| 著者所属 | ||||||||||||||||
| 工学院大 | ||||||||||||||||
| 著者所属 | ||||||||||||||||
| 工学院大 | ||||||||||||||||
| 著者所属 | ||||||||||||||||
| 工学院大 | ||||||||||||||||
| 著者所属 | ||||||||||||||||
| 工学院大 | ||||||||||||||||
| 著者名 |
寺田, 洋人
× 寺田, 洋人
× 慈道, 亮人
× 大崎, 健太
× 藤井, 昭宏
× 田中, 輝雄
|
|||||||||||||||
| 論文抄録 | ||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||
| 内容記述 | 倍々精度演算(DD演算)は,ソフトウェアによる2つの倍精度変数を組み合わせた4倍精度相当の演算である.倍々精度演算は倍精度演算と比べ10倍から20倍の計算量を要するため,計算時間が増加する.また,疎行列ベクトル積(SpMV)はGPUによる高速化が有効である. 本研究では,ディレクティブベースのGPU向けプログラミングモデルOpenMP OffloadingとOpenACCにおいて,自動で設定される並列化の粒度が最適かどうかを調べた.比較のためにCUDAも調べた.その結果,計測する環境あるいは問題行列により,最適な粒度の位置が変化することを確認した | |||||||||||||||
| 書誌レコードID | ||||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||||
| 書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 33-34, 発行日 2023-02-16 |
|||||||||||||||
| 出版者 | ||||||||||||||||
| 言語 | ja | |||||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||||