ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 全国大会
  2. 86回
  3. コンピュータシステム

OpenACCを用いた単精度LU分解のGPU並列化

https://ipsj.ixsq.nii.ac.jp/records/235625
https://ipsj.ixsq.nii.ac.jp/records/235625
0f0d4909-7fb9-4bf7-bd9a-c03472dae0eb
名前 / ファイル ライセンス アクション
IPSJ-Z86-1J-05.pdf IPSJ-Z86-1J-05.pdf (305.4 kB)
Copyright (c) 2024 by the Information Processing Society of Japan
Item type National Convention(1)
公開日 2024-03-01
タイトル
タイトル OpenACCを用いた単精度LU分解のGPU並列化
言語
言語 jpn
キーワード
主題Scheme Other
主題 コンピュータシステム
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
工学院大
著者所属
工学院大
著者所属
工学院大
著者所属
工学院大
著者所属
工学院大
著者名 高山, 智礼

× 高山, 智礼

高山, 智礼

Search repository
久木田, 仁

× 久木田, 仁

久木田, 仁

Search repository
矢島, 雄河

× 矢島, 雄河

矢島, 雄河

Search repository
藤井, 昭宏

× 藤井, 昭宏

藤井, 昭宏

Search repository
田中, 輝雄

× 田中, 輝雄

田中, 輝雄

Search repository
論文抄録
内容記述タイプ Other
内容記述 機械学習の分野では大容量の学習データ自体の精度が低いため,GPUの単精度(あるいは半精度)演算の高い計算能力が注目されている.しかし,GPUの取り扱いにCUDAを用いるとCPU向けのプログラムを大幅に書き換える必要がある.そのため書き換えを大幅に削減可能な,ディレクティブベースのGPU向けプログラミングモデルOpenACCによる利用が広がっている.一方,スーパーコンピュータのベンチマークHPL-MxPでは混合精度演算が用いられており,ここでの主な演算である密行列のLU分解も単精度(あるいは半精度)演算である.本研究では, OpenACCを用いて,HPL-MxP内のLU分解(単精度)をGPU上で並列化し,CPU上での実行を越える性能を得た.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00349328
書誌情報 第86回全国大会講演論文集

巻 2024, 号 1, p. 27-28, 発行日 2024-03-01
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:35:08.357010
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3