ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. コンピューティングシステム(ACS)
  3. Vol.46
  4. No.SIG3(ACS8)

キャッシュマシン向け対称密行列固有値解法の性能・精度評価

https://ipsj.ixsq.nii.ac.jp/records/18431
https://ipsj.ixsq.nii.ac.jp/records/18431
e746d6d6-fc93-4721-98e4-fc313f5ee2b9
名前 / ファイル ライセンス アクション
IPSJ-TACS4603008.pdf IPSJ-TACS4603008.pdf (423.0 kB)
Copyright (c) 2005 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2005-01-15
タイトル
タイトル キャッシュマシン向け対称密行列固有値解法の性能・精度評価
タイトル
言語 en
タイトル Performance and Accuracy of Algorithms for Computing the Eigenvalues of Real Symmetric Matrices on Cache-based Microprocessors
言語
言語 jpn
キーワード
主題Scheme Other
主題 HPC応用
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
名古屋大学大学院工学研究科計算理工学専攻
著者所属(英)
en
Department of Computational Science and Engineering,Nagoya University
著者名 山本, 有作

× 山本, 有作

山本, 有作

Search repository
著者名(英) Yusaku, Yamamoto

× Yusaku, Yamamoto

en Yusaku, Yamamoto

Search repository
論文抄録
内容記述タイプ Other
内容記述 キャッシュマシン上での固有値計算では,Dongarra らの提案した多段化ハウスホルダ法による三重対角化アルゴリズムが広く使われている.しかし,この方法では全演算の半分がデータ再利用性の低い行列ベクトル積となり,通常はピークの10~25%程度の性能しか達成できない.そこで本論文では,演算のほとんどを行列乗算で行えるBischof らおよびWu らのアルゴリズムについて,性能と精度の詳しい評価を行った.Pentium 4 Xeon,Opteron,Alpha 21264A,Ultra SPARC III の4種のプロセッサで性能を評価したところ,3840 元の行列の三重対角化を行う場合にDongarra らのアルゴリズムの約2 倍,ピークの最大50%程度の性能を達成できた.また,4 種のテスト行列で固有値の精度を評価したところ,Dongarra らのアルゴリズムと比べて固有値の相対誤差はやや大きくなるが,増大の程度は多くの場合2~3 倍以内であり,最大でも1 桁程度に抑えられることを明らかにした.
論文抄録(英)
内容記述タイプ Other
内容記述 Dongarra’s tri-diagonalization algorithm has been widely used to compute the eigenvalues of real symmetric matrices on cache-based microprocessors. However, it is known that this algorithm can attain only 10 to 25% of the peak performance because half of the total arithmetic operations are done in the form of matrix-vector multiplication, which has low rate of data reuse. In this paper, we evaluate the performance and accuracy of Bischof’s and Wu’s algorithms, which can perform most of the operations as matrix-matrix multiplication. Experiments on the Pentium 4 Xeon, Opteron, Alpha 21264A and Ultra SPARC III microprocessors show that these algorithms can attain twice the performance of Dongarra’s algorithm when tri-diagonalizing a matrix of order 3840, achieving 50% of the peak performance. The accuracy of computed eigenvalues was found to be slightly lower, but the maximum relative errors lie within 2 to 3 times that of Dongarra’s algorithm in most cases, and within 10 times even in the worst case.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11833852
書誌情報 情報処理学会論文誌コンピューティングシステム(ACS)

巻 46, 号 SIG3(ACS8), p. 81-91, 発行日 2005-01-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7829
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 22:46:08.951991
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3