ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. システム・アーキテクチャ(ARC)
  3. 2023
  4. 2023-ARC-255

疎行列密ベクトル積の高速化のための非ゼロ要素位置辞書圧縮を適用した疎行列格納形式のGPUにおける形式変換の評価

https://ipsj.ixsq.nii.ac.jp/records/231057
https://ipsj.ixsq.nii.ac.jp/records/231057
befdac32-5b38-4bf5-a60b-626cfd579ac3
名前 / ファイル ライセンス アクション
IPSJ-ARC23255018.pdf IPSJ-ARC23255018.pdf (947.5 kB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
ARC:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-11-28
タイトル
タイトル 疎行列密ベクトル積の高速化のための非ゼロ要素位置辞書圧縮を適用した疎行列格納形式のGPUにおける形式変換の評価
タイトル
言語 en
タイトル Evaluation of conversion overheads for the sparse matrix format appliying indices of the non-zero elements dictionary compression to accelerate SpMV on GPU
言語
言語 jpn
キーワード
主題Scheme Other
主題 アクセラレータ
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
北陸先端科学大学院大学
著者所属
富士通Japan株式会社ソリューション開発本部部門ソリューション事業部
著者所属
富士通Japan株式会社ソリューション開発本部部門ソリューション事業部
著者所属
富士通Japan株式会社ソリューション開発本部部門ソリューション事業部
著者所属
北陸先端科学大学院大学
著者名 村上, 舜

× 村上, 舜

村上, 舜

Search repository
米田, 一徳

× 米田, 一徳

米田, 一徳

Search repository
岩村, 尚

× 岩村, 尚

岩村, 尚

Search repository
渡邉, 正宏

× 渡邉, 正宏

渡邉, 正宏

Search repository
井口, 寧

× 井口, 寧

井口, 寧

Search repository
著者名(英) Shun, Murakami

× Shun, Murakami

en Shun, Murakami

Search repository
Kazunori, Yoneda

× Kazunori, Yoneda

en Kazunori, Yoneda

Search repository
Takashi, Iwamura

× Takashi, Iwamura

en Takashi, Iwamura

Search repository
Masahiro, Watanabe

× Masahiro, Watanabe

en Masahiro, Watanabe

Search repository
Yasushi, Inoguchi

× Yasushi, Inoguchi

en Yasushi, Inoguchi

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,数値シミュレーションの複雑化および大規模化に伴い,数百万行を超える規模の行列の要素の多くが 0 である疎行列を係数行列とした連立一次方程式を高速に求解することが求められている.その求解には係数行列の変形が伴わない反復解法が用いられることが多く,主要な計算時間を占める疎行列密ベクトル積(sparse matrix vector products:SpMV)を高速化するために,CPU と比較して高速なメモリ帯域をもつ GPU を活用することにより高速化が図られてきた.大規模な疎行列を,GPU の少ないデバイスメモリへ格納するにあたり,メモリ効率のよい CSR 形式が多く用られている.また,メモリアクセスパターンを改善し高速に SpMV の計算が可能な SELL-C-σ形式が提案されているが,さらなる SpMV の高速化のためには,メモリへのアクセス回数を減らす必要がある.そのため第 190 回 HPC 研究会で,非ゼロ要素位置へ辞書圧縮を適用し,メモリへのアクセスを減らすことによって,GPU 上で SpMV を高速に計算可能な非ゼロ要素位置辞書圧縮疎行列格納形式を提案した.これによって CSR 形式と比較して最大 19.6% の高速化が得られた.これらの改善された格納形式は,SpMV の計算時間は高速化されるが,各形式への変換時間というオーバーヘッドが発生する.本論文では CSR 形式,SELL-C-σ 形式および提案した非ゼロ要素位置辞書圧縮疎行列格納形式について,それぞれ CPU および GPU 上での形式変換時間を評価することによって,形式変換のオーバーヘッドを含めた SpMV 計算高速化の評価を行う.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10096105
書誌情報 研究報告システム・アーキテクチャ(ARC)

巻 2023-ARC-255, 号 18, p. 1-6, 発行日 2023-11-28
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8574
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:53:31.804704
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3