ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. コンピューティングシステム(ACS)
  3. Vol.2
  4. No.2

正方行列向け特異値分解のCUDAによる高速化

https://ipsj.ixsq.nii.ac.jp/records/60775
https://ipsj.ixsq.nii.ac.jp/records/60775
bf79afe6-866d-4a55-9389-941bfa50190c
名前 / ファイル ライセンス アクション
IPSJ-TACS0202011.pdf IPSJ-TACS0202011.pdf (385.9 kB)
Copyright (c) 2009 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2009-07-02
タイトル
タイトル 正方行列向け特異値分解のCUDAによる高速化
タイトル
言語 en
タイトル Acceleration of the Singular Value Decomposition Algorithm for Square Matrices Using CUDA
言語
言語 jpn
キーワード
主題Scheme Other
主題 GPU応用
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
名古屋大学大学院工学研究科計算理工学専攻
著者所属
名古屋大学大学院工学研究科計算理工学専攻
著者所属
京都大学化学研究所
著者所属
京都大学大学院情報学研究科
著者所属(英)
en
Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University
著者所属(英)
en
Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University
著者所属(英)
en
Institute for Chemical Research, Kyoto University
著者所属(英)
en
Graduate School of Infomatics, Kyoto University
著者名 深谷, 猛 山本, 有作 畝山, 多加志 中村, 佳正

× 深谷, 猛 山本, 有作 畝山, 多加志 中村, 佳正

深谷, 猛
山本, 有作
畝山, 多加志
中村, 佳正

Search repository
著者名(英) Takeshi, Fukaya Yusaku, Yamamoto Takashi, Uneyama Yoshimasa, Nakamura

× Takeshi, Fukaya Yusaku, Yamamoto Takashi, Uneyama Yoshimasa, Nakamura

en Takeshi, Fukaya
Yusaku, Yamamoto
Takashi, Uneyama
Yoshimasa, Nakamura

Search repository
論文抄録
内容記述タイプ Other
内容記述 本論文では GPGPU 向けの統合開発環境 CUDA を用いた,正方行列の特異値分解の高速化について報告する.正方行列の特異値分解では,計算対象の行列を二重対角行列に変換してから特異値分解を行い,その後逆変換を行うことで,もとの行列の特異値分解を得る.本論文では CUDA の BLAS ライブラリ (CUBLAS) の中の高性能な SGEMM (行列乗算ルーチン) を効率的に利用することで,比較的少ないコストで大幅な高速化を行うことを目指し,演算の大部分が BLAS によって行われる二重対角化と逆変換部分を GPU を用いて高速化した.実装にあたっては,行列乗算を中心に二重対角化が可能な Bischof の手法が GPU 向けに適していることを簡単な性能予測を通して確認し,この手法を採用した.また,各計算ステップにおける CPU と GPU との仕事の適切な分担や計算のオーバラップについても考慮した.GPU として NVIDIA の GeForce8800 GTX を用いた性能評価の結果,CPU (Intel Core2 Duo 1.86GHz 2 コア使用)のみで計算する場合と比べて,5,120 次元の正方行列の特異値分解の計算が約 4 倍高速化できることを確認した.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we report the result of acceleration of computing the singular value decomposition (SVD) for a square matrix using CUDA, which is an integrated development environment for GPGPU. Computing of the SVD for a square matrix consists of the following three parts: bidiagonalization of the input matrix, the SVD of the bidiagonal matrix, and inverse transformation. Among them, we accelerate the first and the third step using GPU. This is because it is easy to use the CUBLAS, the BLAS library provided in CUDA, in these two steps. Through simple performance prediction, we assessed that the Bischof's method, in which bidiagonalization can be computed with matrix multiplications, is effective for computation using GPU. Therefore we implemented the algorithm for the SVD based on such method. When computing the SVD of a 5,120×5,120 matrix, we obtained about four times speedup using a GPU over using only a CPU (Intel Core2 Duo, 1.86 GHz, using 2 cores).
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11833852
書誌情報 情報処理学会論文誌コンピューティングシステム(ACS)

巻 2, 号 2, p. 98-109, 発行日 2009-07-02
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7829
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 02:59:48.803779
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3