WEKO3
アイテム
ILIB-RLU:疎行列を密行列として扱う自動チューニング機能付きLU分解ルーチンの性能評価
https://ipsj.ixsq.nii.ac.jp/records/29438
https://ipsj.ixsq.nii.ac.jp/records/29438a6e43baf-6045-4cbd-a5de-2c6a9a8a4451
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-08-03 | |||||||
タイトル | ||||||||
タイトル | ILIB-RLU:疎行列を密行列として扱う自動チューニング機能付きLU分解ルーチンの性能評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | ILIB - RIU : An Automatically Tuned Parallel Dense LU Factorization Routine and Its Performance Evaluation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院理学系研究科情報科学専攻 | ||||||||
著者所属 | ||||||||
東京大学大学院理学系研究科情報科学/日本学術振興会 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Science, Graduate School of Science, the University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Science, Graduate School of Science, the University of Tokyo/Research Fellow of the Japan Society for the Promotion of Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, the University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, the University of Tokyo | ||||||||
著者名 |
大澤, 清
× 大澤, 清
|
|||||||
著者名(英) |
Kiyoshi, Oosawa
× Kiyoshi, Oosawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | この論文では数値計算を行う際に用いる,計算機に適したパラメタを自動的に探し実行する機能を付加した,並列数値計算ライブラリI-LIB(Intelligent LIBrary)のルーチンのひとつである,連立一次方程式の求解におけるLU分解ルーチン(ILIB_-RLU)の機能と性能について報告する.ILIB_-RLUは,係数行列が疎行列の場合も密行列として扱い直接法によって解くことにより,行列の性質が悪い場合においても反復解法のように解の精度を考慮する必要がない.また通常の密行列のLU分解と異なり,事前に係数行列の構造を調べて演算の範囲を限定することで演算時間の短縮を図っている.さらにI-LIBの機能として,ユーザが直接指定することなしにライブラリ自体が性能に関する最適化を行う自動チューニング機能を付加してさらに高速化を図った.分散メモリ型並列計算機であるHITACHI SR8000とHITACHI SR2201を用いた性能評価の結果,今回提案した自動チューニング機能により決定されたパラメタを用いることで,実際の応用で使われる行列サイズ41296の問題がSR8000の理論性能に対し68.6%の効率で解くことができ,通常のLU分解と比較して37.0倍の速度向上を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we report functions and performance for LU factorization routine (ILIB_-RLU) as a system of linear equations solver. It is one of I-LIB (Intelligent LIBrary) routines which include auto-tuning facilities. In the use of ILIB_-RLU, users do not need to care precisions of answers, since coefficient matricies are treated as dense matricies and the equations are solved by a direct method. ILIB_-RLU reduces computaion area in order to attain speed-up. The auto-tuning facilities optimize performance without specifying parameters. The HITACHI SR2201 and HITACHI SR8000 both of which are distributed memory parallel machines are used in our performance evaluation. From the experimental results, we found that ILIB_-RLU routines attains 68.6% efficiency to theoretical peak performance and 37.O times speed-up to normal LU factorization for the real problem size of 41296 by our auto-tuning facilities. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2000, 号 73(2000-HPC-082), p. 25-30, 発行日 2000-08-03 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |