WEKO3
アイテム
アクセラレータのメモリ容量を超えるデータをパイプライン処理するためのディレクティブ
https://ipsj.ixsq.nii.ac.jp/records/96576
https://ipsj.ixsq.nii.ac.jp/records/96576be761db9-600c-4eb6-9d50-dc2a3f622171
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-12-09 | |||||||
タイトル | ||||||||
タイトル | アクセラレータのメモリ容量を超えるデータをパイプライン処理するためのディレクティブ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Directives for pipelined processing of data exceeding the accelerator memory capacity | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | GPU | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University | ||||||||
著者名 |
中野, 瑛仁
× 中野, 瑛仁
|
|||||||
著者名(英) |
Akihito, Nakano
× Akihito, Nakano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,アクセラレータのメモリ容量を超える大規模データを,単一アクセラレータ上で高速処理するためのディレクティブ仕様 PACC(Pipelined ACCelerator) を提案し,その実装を示す.PACC は,既存のアクセラレータ向けディレクティブ仕様 OpenACC を拡張したものであり,ディレクティブの挿入のみで大規模データの分割処理を可能とする.PACC のトランスレータは,PACC ディレクティブが付加されたプログラムを入力とし,データを分割処理するよう書き換え,OpenACC ディレクティブを挿入したプログラムを出力する.さらに,PACC が出力したプログラムは,分割したデータをパイプライン処理することで,CPU・アクセラレータ間のデータ転送時間の一部をアクセラレータ上の計算時間により隠蔽する.この隠蔽は,分割数を指定するための PACC ディレクティブを用いてチューニング可能である.実験では,CPU 側のメモリ容量が 32GB,アクセラレータのメモリが容量 5GBの PC において,27GB 程度のデータまで処理できることを確認した.また,分割したデータをパイプライン処理することにより,最大で 2.6 倍の高速化を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we present a directive specification, named pipelined accelerator (PACC), and its implementation for acceleration of large-scale computation whose data size exceeds the memory capacity of an accelerator. PACC is an extension of OpenACC, an existing directive specification for accelerators. Our specification realizes partitioning of large-scale data according to inserted directives. Given a program with PACC directives, our PACC translator rewrite the program as an OpenACC program so that data can be partitioned for execution. Furthermore, the generated program processes partitioned data in a pipeline so that data transfer time between the CPU and accelerator can be overlapped with computation time on the accelerator. This overlap can be tuned by using PACC directives that specify the number of data partitions. Experimental results show that PACC realizes large-scale computation with data size of up to 27 GB on a PC whose main and accelerator memory capacities are 32 GB and 5 GB, respectively. We also find that our pipelined execution increases the performance by a maximum factor of 2.6. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2013-HPC-142, 号 22, p. 1-8, 発行日 2013-12-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |