WEKO3
アイテム
VPP300/500におけるBLASのベクトル化
https://ipsj.ixsq.nii.ac.jp/records/23950
https://ipsj.ixsq.nii.ac.jp/records/23950fe0f3a61-70a0-4268-a439-7f5d9a696ca6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-03-06 | |||||||
タイトル | ||||||||
タイトル | VPP300/500におけるBLASのベクトル化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Vectorization of BLAS for VPP300 and VPP500 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
理化学研究所計算科学研究室 | ||||||||
著者所属 | ||||||||
理化学研究所計算科学研究室 | ||||||||
著者所属 | ||||||||
富士通(株)HPC本部第一開発統括部第二開発部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computational Science Laboratory, RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computational Science Laboratory, RIKEN | ||||||||
著者所属(英) | ||||||||
en | ||||||||
FUJITSU LIMITED | ||||||||
著者名 |
傳田, 紀代美
× 傳田, 紀代美
|
|||||||
著者名(英) |
Kiyomi, Denda
× Kiyomi, Denda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | VPP300/500においてBLAS (asic Linear Algebra Subprogram)のベクトル化を、富士通HPC本部との共同研究/開発として行った。今回の仕事は、並列ベクトル化LAPACKをVPP300へ実装するための第一歩として位置づけられ、アーキテクチャに最適化したベクトル化BLASを作成して、BLASを参照している数値計算ライブラリLAPACK (inear Algebra PACKag)の性能向上を目指すことを目的としている。アーキテクチャの特性を考慮し、ベクトルレジスタを最も有効に利用するようにソースを改良した。また行列サイズに応じて最も速いアルゴリズムを選択させることで、広い範囲で高性能が得られるようになった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have vectorized BLAS in order to be fit for VPP300 or VPP500. This has been done as a joint research between Computational Science Laboratory of RIKEN and FUJITSU LIMITED. This is the first step to our final goal of this work; a development of a vectorized-parallel LAPACK for VPP300. The optimization of BLAS results in a high-performance LAPACK, because LAPACK refers BLAS as subroutines. We have revised BLAS in order to use the fastest algorism case by case and to make use of the vector registers effectively. We have thus obtained a good performance in a wide range of matrix sizes. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 1997, 号 22(1996-ARC-123), p. 1-6, 発行日 1997-03-06 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |