| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-08-01 |
| タイトル |
|
|
タイトル |
HPCにおけるHSAの性能評価 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Effectiveness of Heterogeneous System Architecture in High Performance Computing |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
GPU |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属(英) |
|
|
|
en |
|
|
University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
University of Tokyo |
| 著者名 |
石村, 脩
吉本, 芳英
|
| 著者名(英) |
Osamu, Ishimura
Yoshihide, Yoshimoto
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
今日のHigh Performance Computing (HPC) では,処理の高速化のため,General Purpose computing on GPU (GPGPU) が頻繁に用いられている.しかし,一般的にこれらで用いられている GPU は CPU に汎用バスを介して接続されているため,CPU と GPU の間のデータ転送や処理の切り替えが遅く,粒度の細かい並列処理には向かない.一方で近年開発が進められている Heterogeneous System Architecture (HSA) では,汎用バスを介したデータ転送ではなく CPU と GPU で仮想空間を含めて統合されたメモリによるデータ共有 (Heterogeneous Uniform Memory Access) やカーネルモードへのコンテキストスイッチをせずに GPU にジョブを渡すことを可能とする機構 (Heterogeneous Queuing) が用意され,この問題への対応がなされていると主張されている.しかし,HSA が HPC において,実際にどの程度の効果を持つものであるか検証した先行研究は存在しない.そこで本研究では,HSA を採用した APU (Godavari) の性能評価を,データのアクセス遅延・バンド幅,および GPU のジョブの起動遅延に注目して行った. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, General Purpose computing on GPU (GPGPU) has frequently been used as an acceleration technique in High Performance Computing (HPC). Most of the GPUs used in GPGPU are discrete GPUs which are connected to CPUs via general purpose buses. Therefore, they are not effective for fine grained parallelism because of their large latency in a context switch and slow data transfer. Heterogeneous System Architecture (HSA), which has been developed recently, provides unified memory access including the virtual space between CPU and GPU without the transfer (Heterogeneous Uniform Memory Access) and job queuing without kernel context switch (Heterogeneous Queuing) in order to address this problem. However, there is no previous research on the effectiveness of HSA in HPC. In this paper, from the viewpoint of latency and bandwidth in data access and job queuing latency, we evaluated the performance of Godavari that is an APU implements HSA. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2016-HPC-155,
号 14,
p. 1-6,
発行日 2016-08-01
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |