WEKO3
アイテム
並列疎行列ベクトル積における最適なアルゴリズム選択の効果
https://ipsj.ixsq.nii.ac.jp/records/29319
https://ipsj.ixsq.nii.ac.jp/records/293190f4d9019-d6d2-4151-811b-dccd3a5e793f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-03-07 | |||||||
タイトル | ||||||||
タイトル | 並列疎行列ベクトル積における最適なアルゴリズム選択の効果 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | The Effect of Optimal Algorithm Selection of Parallel Sparse Matrix - Vector Multiplication | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科コンピュータ科学専攻 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
科学技術振興事業団,さきがけ研究21 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Information Science and Technology, the University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, the University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
PRESTO, Japan Science and Technology Corporation (JST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, the University of Tokyo | ||||||||
著者名 |
工藤, 誠
黒田, 久泰
片桐, 孝洋
金田, 康正
× 工藤, 誠 黒田, 久泰 片桐, 孝洋 金田, 康正
|
|||||||
著者名(英) |
Makoto, Kudoh
Hisayasu, Kuroda
Takahiro, Katagiri
Yasumasa, Kanada
× Makoto, Kudoh Hisayasu, Kuroda Takahiro, Katagiri Yasumasa, Kanada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 並列疎行列ベクトル積の性能は行列の構造や計算機の性質に大きく依存するため,これらの性質に合わせた高速化手法で計算することが重要である.本論文では筆者らの作成した複数の高速化手法を含んだ並列疎行列ベクトル積のルーチンを紹介する.また行列や計算機の性質に応じて最適な高速化手法を選択した場合の性能を,従来法である妥当な固定手法を用いた場合の性能と比較する.4機種の並列計算機上での実験では,最適なアルゴリズム選択により平均して1.29倍の速度向上が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The computational performance of parallel sparse matrix-vector multiplication (SpMxV) depends highly on the non-zero structure of the target matrix and the nature of machine's architecture. Therefore it is important to select the best optimization method according to these characteristics. In this paper, our parallel SpMxV routine which includes several optimization algorithms is described, and the performance with optimal algorithm is compared to that with uniform default algorithm on 4 kinds of parallel machines. The average speed-up of 1.29 is obtained. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2002, 号 22(2001-HPC-089), p. 151-156, 発行日 2002-03-07 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |