WEKO3
アイテム
正方行列向け特異値分解のCUDAによる高速化
https://ipsj.ixsq.nii.ac.jp/records/60775
https://ipsj.ixsq.nii.ac.jp/records/60775bf79afe6-866d-4a55-9389-941bfa50190c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-07-02 | |||||||
タイトル | ||||||||
タイトル | 正方行列向け特異値分解のCUDAによる高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Acceleration of the Singular Value Decomposition Algorithm for Square Matrices Using CUDA | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | GPU応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科計算理工学専攻 | ||||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科計算理工学専攻 | ||||||||
著者所属 | ||||||||
京都大学化学研究所 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute for Chemical Research, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Infomatics, Kyoto University | ||||||||
著者名 |
深谷, 猛
山本, 有作
畝山, 多加志
中村, 佳正
× 深谷, 猛 山本, 有作 畝山, 多加志 中村, 佳正
|
|||||||
著者名(英) |
Takeshi, Fukaya
Yusaku, Yamamoto
Takashi, Uneyama
Yoshimasa, Nakamura
× Takeshi, Fukaya Yusaku, Yamamoto Takashi, Uneyama Yoshimasa, Nakamura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では GPGPU 向けの統合開発環境 CUDA を用いた,正方行列の特異値分解の高速化について報告する.正方行列の特異値分解では,計算対象の行列を二重対角行列に変換してから特異値分解を行い,その後逆変換を行うことで,もとの行列の特異値分解を得る.本論文では CUDA の BLAS ライブラリ (CUBLAS) の中の高性能な SGEMM (行列乗算ルーチン) を効率的に利用することで,比較的少ないコストで大幅な高速化を行うことを目指し,演算の大部分が BLAS によって行われる二重対角化と逆変換部分を GPU を用いて高速化した.実装にあたっては,行列乗算を中心に二重対角化が可能な Bischof の手法が GPU 向けに適していることを簡単な性能予測を通して確認し,この手法を採用した.また,各計算ステップにおける CPU と GPU との仕事の適切な分担や計算のオーバラップについても考慮した.GPU として NVIDIA の GeForce8800 GTX を用いた性能評価の結果,CPU (Intel Core2 Duo 1.86GHz 2 コア使用)のみで計算する場合と比べて,5,120 次元の正方行列の特異値分解の計算が約 4 倍高速化できることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we report the result of acceleration of computing the singular value decomposition (SVD) for a square matrix using CUDA, which is an integrated development environment for GPGPU. Computing of the SVD for a square matrix consists of the following three parts: bidiagonalization of the input matrix, the SVD of the bidiagonal matrix, and inverse transformation. Among them, we accelerate the first and the third step using GPU. This is because it is easy to use the CUBLAS, the BLAS library provided in CUDA, in these two steps. Through simple performance prediction, we assessed that the Bischof's method, in which bidiagonalization can be computed with matrix multiplications, is effective for computation using GPU. Therefore we implemented the algorithm for the SVD based on such method. When computing the SVD of a 5,120×5,120 matrix, we obtained about four times speedup using a GPU over using only a CPU (Intel Core2 Duo, 1.86 GHz, using 2 cores). | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 2, 号 2, p. 98-109, 発行日 2009-07-02 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |