WEKO3
アイテム
SR8000向け固有値計算の高速化手法
https://ipsj.ixsq.nii.ac.jp/records/29556
https://ipsj.ixsq.nii.ac.jp/records/295560186be45-f0be-4fb6-b5e7-382eeee050b2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-08-02 | |||||||
タイトル | ||||||||
タイトル | SR8000向け固有値計算の高速化手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | High Performance Eigenvalue Computation on the HITACHI SR8000 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)日立製作所中央研究所 | ||||||||
著者所属 | ||||||||
(株)日立超LSIシステムズ | ||||||||
著者所属 | ||||||||
(株)日立製作所中央研究所 | ||||||||
著者所属 | ||||||||
(株)日立超LSIシステムズ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Central Research Laboratory, Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi ULSI Systems Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Central Research Laboratory, Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi ULSI Systems Co., Ltd. | ||||||||
著者名 |
直野, 健
× 直野, 健
|
|||||||
著者名(英) |
Ken, Naono
× Ken, Naono
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | スーパーテクニカルサーバSR8000向けに固有値計算の高速化手法を提案し、評価した。中でも処理の重いハウスホルダ変換の部分に対し、ブロック化によるデータ分割、対角ブロック部の正方演算化、ループ融合による対演算ロード・ストア回数の低減による高速化を行った。これにより1ノードの性能では4000次元において約4.0Gflop/sと、同じピーク性能8Gflop/sのS?3800向け製品MATRIX/HAPの約2.9Gflop/sに比べ大きく性能を向上できた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The methods of high performance eigenvalue computation on the HITACHI SR8000 are described and evaluated. To achieve high performance computation of the Householder transformation procedure, we adopted the blocked data distribution, the rectangular computation in the diagonal blocks, and the loop integration for reducing the number of load/store. On the 1 node of the SR8000, we achieved about 4.0 Gflop/s in the 4000-dim Householder transformations. This is much better than the 2.9 Gflop/s of the Matrix Library's on the HITACHI S-3800 which has the same peak performance with 1 node of the SR8000. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 1999, 号 66(1999-HPC-077), p. 119-124, 発行日 1999-08-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |