WEKO3
アイテム
データストリーム処理におけるGPU統合型CPUの予備的評価
https://ipsj.ixsq.nii.ac.jp/records/77608
https://ipsj.ixsq.nii.ac.jp/records/776088c587e79-4111-4ef0-a97b-2fbbec6d0c9f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-09-29 | |||||||
タイトル | ||||||||
タイトル | データストリーム処理におけるGPU統合型CPUの予備的評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Preliminary Evaluation of CPU integrated with GPU for Data Stream Processing | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 高性能計算、並列計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属 | ||||||||
東京工業大学/IBM東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyo Institute of Technology / IBM Research Tokyo | ||||||||
著者名 |
松浦, 紘也
× 松浦, 紘也
|
|||||||
著者名(英) |
Hiroya, Matsuura
× Hiroya, Matsuura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | CPU と GPU をオンダイ統合した APU の登場により,高スループットと低レイテンシの両立が求められるデータストリーム処理での GPU のさらなる活用が期待される.本研究では,マイクロベンチマークと株価加重平均 VWAP,異常検知アルゴリズム FELIX SST でこれを検証し,詳細なプロファイルを行うことで APU の性能特性を評価した.この結果,APU では外付け GPU と比べカーネル起動に 125.7 倍,メモリ送受信には 0.5ms から 2ms のオーバヘッドが見られ,現状ではデータストリーム処理への適用は困難であるが,行列積計算では CPU の 58.6 倍ものスループットがあり,ドライバや実行環境が改善されれば APU の適用が有効であることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | APU is a new computing device that integrates GPU with CPU. We expect that APU can achieve higher performance than CPU owing to many computing units and much faster response compared with discrete GPU because APU shares memory controller between CPU cores with GPU cores. Such devices are suitable for Data Stream Processing, a new computing paradigm, which needs both high throughput and low latency. In this paper, we examine APU's performance in detail to determine whether it would be suitable for Data Stream Processing with microbenchmarks, VWAP (Volume Wated Average Price of Stocks), FELIX SST (Change Point Detecting Algorithm) and their profiling. APU achieved 58.6 times faster than CPU on Matrix Multiplication but have 125.7 times longer response time to launch kernel program and 0.5ms - 2ms overhead to transfer data compared with discrete GPU. According to these evaluation results, we conclude that APU can be a suitable for Data Stream Processing if there are improvements of APU drivers and environments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2011-HPC-131, 号 1, p. 1-8, 発行日 2011-09-29 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |