WEKO3
-
RootNode
アイテム
行列積を用いた古典Gram-Schmidt直交化法の並列化
https://ipsj.ixsq.nii.ac.jp/records/18190
https://ipsj.ixsq.nii.ac.jp/records/18190863b3c6d-2149-4576-9ec0-2cbaef8219b0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-06-26 | |||||||
タイトル | ||||||||
タイトル | 行列積を用いた古典Gram-Schmidt直交化法の並列化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Parallel Implementation of Classical Gram-Schmidt Orthogonalization Using Matrix Multiplication | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者名 |
横澤, 拓弥
高橋, 大介
朴, 泰祐
佐藤三久
× 横澤, 拓弥 高橋, 大介 朴, 泰祐 佐藤三久
|
|||||||
著者名(英) |
Takuya, Yokozawa
Daisuke, Takahashi
Taisuke, Boku
Mitsuhisa, Sato
× Takuya, Yokozawa Daisuke, Takahashi Taisuke, Boku Mitsuhisa, Sato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,直交化アルゴリズムの1つである古典Gram-Schmidt法(CGS 法)の効率的な実装を行い,並列化して評価した結果について述べる.CGS法においては,内積計算とベクトル変換を行列積に変更することで高速化できることが知られている.本論文では,CGS法を行列積で行う手法を拡張し,行列積を適用できる範囲の比率を高めることで性能を改善することができることを示す.また,行列積の実装上の特徴から,最適な分割手法が存在することを示す.提案する手法をPCクラスタに実装し,性能評価を行った.その結果,32ノードのXeon 3 GHz PCクラスタにおいて,naiveな実装に対し約5.36倍の高速化となり,約122.9GFLOPSの性能を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose an efficient parallel implementation of classical Gram-Schmidt (CGS) orthogonalization. It is known that the CGS orthogonalization of a matrix can be altered into a matrix multiplication. We show that the CGS orthogonalization with matrix multiplication improves performance effectively and blocking method using square matrix multiplication improve performance because of matrix's row-column ratio affects DGEMM routine performance. We succeeded in obtaining performance of approximately 122.9GFLOPS on a 32-node Xeon 3 GHz PC cluster. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 1, 号 1, p. 61-72, 発行日 2008-06-26 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |