WEKO3
アイテム
キャッシュマシン向け対称密行列固有値解法の性能・精度評価
https://ipsj.ixsq.nii.ac.jp/records/18431
https://ipsj.ixsq.nii.ac.jp/records/18431e746d6d6-fc93-4721-98e4-fc313f5ee2b9
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-01-15 | |||||||
| タイトル | ||||||||
| タイトル | キャッシュマシン向け対称密行列固有値解法の性能・精度評価 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Performance and Accuracy of Algorithms for Computing the Eigenvalues of Real Symmetric Matrices on Cache-based Microprocessors | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | HPC応用 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 名古屋大学大学院工学研究科計算理工学専攻 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computational Science and Engineering,Nagoya University | ||||||||
| 著者名 |
山本, 有作
× 山本, 有作
|
|||||||
| 著者名(英) |
Yusaku, Yamamoto
× Yusaku, Yamamoto
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | キャッシュマシン上での固有値計算では,Dongarra らの提案した多段化ハウスホルダ法による三重対角化アルゴリズムが広く使われている.しかし,この方法では全演算の半分がデータ再利用性の低い行列ベクトル積となり,通常はピークの10~25%程度の性能しか達成できない.そこで本論文では,演算のほとんどを行列乗算で行えるBischof らおよびWu らのアルゴリズムについて,性能と精度の詳しい評価を行った.Pentium 4 Xeon,Opteron,Alpha 21264A,Ultra SPARC III の4種のプロセッサで性能を評価したところ,3840 元の行列の三重対角化を行う場合にDongarra らのアルゴリズムの約2 倍,ピークの最大50%程度の性能を達成できた.また,4 種のテスト行列で固有値の精度を評価したところ,Dongarra らのアルゴリズムと比べて固有値の相対誤差はやや大きくなるが,増大の程度は多くの場合2~3 倍以内であり,最大でも1 桁程度に抑えられることを明らかにした. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Dongarra’s tri-diagonalization algorithm has been widely used to compute the eigenvalues of real symmetric matrices on cache-based microprocessors. However, it is known that this algorithm can attain only 10 to 25% of the peak performance because half of the total arithmetic operations are done in the form of matrix-vector multiplication, which has low rate of data reuse. In this paper, we evaluate the performance and accuracy of Bischof’s and Wu’s algorithms, which can perform most of the operations as matrix-matrix multiplication. Experiments on the Pentium 4 Xeon, Opteron, Alpha 21264A and Ultra SPARC III microprocessors show that these algorithms can attain twice the performance of Dongarra’s algorithm when tri-diagonalizing a matrix of order 3840, achieving 50% of the peak performance. The accuracy of computed eigenvalues was found to be slightly lower, but the maximum relative errors lie within 2 to 3 times that of Dongarra’s algorithm in most cases, and within 10 times even in the worst case. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11833852 | |||||||
| 書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 46, 号 SIG3(ACS8), p. 81-91, 発行日 2005-01-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7829 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||