WEKO3
アイテム
CPUとGPUを用いた並列GEMM演算の提案と実装
https://ipsj.ixsq.nii.ac.jp/records/18312
https://ipsj.ixsq.nii.ac.jp/records/183120e2aa64f-7b5f-40ef-a397-97b0f43dd655
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-09-15 | |||||||
タイトル | ||||||||
タイトル | CPUとGPUを用いた並列GEMM演算の提案と実装 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Proposal and Implementation of Parallel GEMM Routine Using CPU and GPU | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 / 現在,東京工業大学大学院情報理工学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 | ||||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro-Communications / Presently with Graduate School of Information Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, The University of Electro-Communications | ||||||||
著者名 |
大島, 聡史
吉瀬, 謙二
片桐, 孝洋
弓場, 敏嗣
× 大島, 聡史 吉瀬, 謙二 片桐, 孝洋 弓場, 敏嗣
|
|||||||
著者名(英) |
Satoshi, Ohshima
Kenji, Kise
Takahiro, Katagiri
Toshitsugu, Yuba
× Satoshi, Ohshima Kenji, Kise Takahiro, Katagiri Toshitsugu, Yuba
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 画像処理用のハードウェアであるGPU(Graphics Processing Unit)の性能向上にともない,GPUの演算能力を様々な分野で活用する研究がさかんである.我々はGPUを用いた新しい計算方式として,CPUとGPUの並列処理による数値計算方式を提案してきた.本稿では既存の数値計算ライブラリに対して計算方式を適用し,性能チューニングのための検討およびベンチマークプログラムを用いた性能評価を行った.計算方式をBLASのGEMMに適用して並列GEMMを作成し,これを用いてHPLベンチマークを実行したところ,Pentium43.0GHz単体での実行と比べて最大で1.45倍の性能を達成した.GPUによる演算が単精度であるためHPLの高速化としては問題があるものの,計算方式が現実的なアプリケーションに適用できる可能性を示すことができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | GPUs for numerical computations are becoming an attractive research topics. We have proposed a new computation method of GPU, which utilizes parallel processing based on CPU and GPU. In this paper, we apply this method to existing numerical computation library. We examine a performance tuning method and execute performance experiments using a benchmark program. We also apply the method to the GEMM routine of BLAS and execute the HPL benchmark. As a result, the performance can be improved to 1. 45 times by our method, compared with a CPU only environment using Pentium 43.0GHz. There is a precision problem depending on GPU’s arithmatic precision, but we show such a potentiality that our method can be applied to various applications. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 47, 号 SIG12(ACS15), p. 317-328, 発行日 2006-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |