行列積を用いた古典Gram-Schmidt直交化法の並列化

横澤, 拓弥; 高橋, 大介; 朴, 泰祐; 佐藤三久; Takuya, Yokozawa; Daisuke, Takahashi; Taisuke, Boku; Mitsuhisa, Sato

WEKO3

インデックスツリー

RootNode

アイテム

行列積を用いた古典Gram-Schmidt直交化法の並列化

https://ipsj.ixsq.nii.ac.jp/records/18190

名前 / ファイル	ライセンス	アクション
IPSJ-TACS0101008.pdf (422.9 kB)	Copyright (c) 2008 by the Information Processing Society of Japan
オープンアクセス

Item type

Trans(1)

公開日

2008-06-26

タイトル

行列積を用いた古典Gram-Schmidt直交化法の並列化

タイトル

言語

タイトル

Efficient Parallel Implementation of Classical Gram-Schmidt Orthogonalization Using Matrix Multiplication

言語

jpn

キーワード

主題Scheme

Other

主題

数値計算

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_6501

資源タイプ

journal article

著者所属

筑波大学大学院システム情報工学研究科

著者所属

筑波大学大学院システム情報工学研究科

著者所属

筑波大学大学院システム情報工学研究科

著者所属

筑波大学大学院システム情報工学研究科

著者所属(英)

Graduate School of Systems and Information Engineering, University of Tsukuba

著者所属(英)

Graduate School of Systems and Information Engineering, University of Tsukuba

著者所属(英)

Graduate School of Systems and Information Engineering, University of Tsukuba

著者所属(英)

Graduate School of Systems and Information Engineering, University of Tsukuba

著者名

横澤, 拓弥高橋, 大介朴, 泰祐佐藤三久

著者名(英)

Takuya, Yokozawa Daisuke, Takahashi Taisuke, Boku Mitsuhisa, Sato

論文抄録

内容記述タイプ

Other

内容記述

本論文では，直交化アルゴリズムの1つである古典Gram-Schmidt法（CGS 法）の効率的な実装を行い，並列化して評価した結果について述べる．CGS法においては，内積計算とベクトル変換を行列積に変更することで高速化できることが知られている．本論文では，CGS法を行列積で行う手法を拡張し，行列積を適用できる範囲の比率を高めることで性能を改善することができることを示す．また，行列積の実装上の特徴から，最適な分割手法が存在することを示す．提案する手法をPCクラスタに実装し，性能評価を行った．その結果，32ノードのXeon 3 GHz PCクラスタにおいて，naiveな実装に対し約5.36倍の高速化となり，約122.9GFLOPSの性能を得ることができた．

論文抄録(英)

内容記述タイプ

Other

内容記述

In this paper, we propose an efficient parallel implementation of classical Gram-Schmidt (CGS) orthogonalization. It is known that the CGS orthogonalization of a matrix can be altered into a matrix multiplication. We show that the CGS orthogonalization with matrix multiplication improves performance effectively and blocking method using square matrix multiplication improve performance because of matrix's row-column ratio affects DGEMM routine performance. We succeeded in obtaining performance of approximately 122.9GFLOPS on a 32-node Xeon 3 GHz PC cluster.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AA11833852

書誌情報

情報処理学会論文誌コンピューティングシステム（ACS）

巻 1, 号 1, p. 61-72, 発行日 2008-06-26

ISSN

収録物識別子タイプ

ISSN

収録物識別子

1882-7829

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-22 22:55:21.087672

Show All versions

Cite as

佐藤三久, 2008: 情報処理学会, 61–72 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

行列積を用いた古典Gram-Schmidt直交化法の並列化

× 横澤, 拓弥高橋, 大介朴, 泰祐佐藤三久

× Takuya, Yokozawa Daisuke, Takahashi Taisuke, Boku Mitsuhisa, Sato

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

行列積を用いた古典Gram-Schmidt直交化法の並列化

× 横澤, 拓弥 高橋, 大介 朴, 泰祐 佐藤三久

× Takuya, Yokozawa Daisuke, Takahashi Taisuke, Boku Mitsuhisa, Sato

Versions

Share

Cite as

エクスポート

× 横澤, 拓弥高橋, 大介朴, 泰祐佐藤三久