Item type |
SIG Technical Reports(1) |
公開日 |
2015-07-28 |
タイトル |
|
|
タイトル |
ヒストグラム生成を高速化するためのOpenACCオプティマイザの検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Preliminary OpenACC Optimizer for Accelerating Histogram Generation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
プログラミングシステム |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
値 |
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 |
著者所属 |
|
|
値 |
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 |
著者所属 |
|
|
値 |
大阪大学大学院情報科学研究科コンピュータサイエンス専攻 |
著者所属(英) |
|
|
言語 |
en |
|
値 |
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University |
著者所属(英) |
|
|
言語 |
en |
|
値 |
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University |
著者所属(英) |
|
|
言語 |
en |
|
値 |
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University |
著者名 |
池田, 圭
伊野, 文彦
萩原, 兼一
|
著者名(英) |
Kei, Ikeda
Fumihiko, Ino
Kenichi, Hagihara
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,OpenACC により記述されたヒストグラム生成のコードを GPU(Graphics Processing Unit) 向けに自動最適化するオプティマイザについて検討する.GPU によるヒストグラム生成では,局所ヒストグラムの生成により,アトミック演算による書き込みの競合を削減できる.この高速化手法は OpenACC で記述できる.しかし,OpenACC ディレクティブを逐次コードに挿入するだけでは記述できない.したがって,逐次コードを書き換える必要があるため,コードの性能可搬性が損なわれる.そこで,OpenACC コードからヒストグラム生成のコーディングパターンを抽出し,GPU 向けの高速化手法を適用するオプティマイザを提案する.性能可搬性を損なわずにコードを最適化するためには,コードの書き換えを自動化する機構が有用であると考える.予備実験では,オプティマイザによる最適化手順にしたがってコードを手動で書き換えた.NVIDIA 社の GPU を用いて得た結果により,局所ヒストグラムの生成による高速化を確認できた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we present a preliminary OpenACC optimizer that automatically optimizes a histogram generation code for a graphics processing unit (GPU). In GPU-accelerated histogram generation, atomic write conflicts can be reduced by using multiple local histograms. This acceleration method can be implemented as OpenACC code. However, OpenACC directives are not sufficient to apply the method to the sequential code. Owing to this restriction, the sequential code must be partially rewritten, and thus, the performance portability is eliminated from the code. To solve this issue, we propose an optimizer that automatically identifies histogram generation part from the OpenACC code to apply the acceleration method for the GPU. We think that automating code rewriting procedure is useful to optimize the code performance without losing the performance portability. In preliminary experiments, we manually rewrite four application code according to the optimization procedure. Results obtained on an NVIDIA GPU show that our optimization procedure successfully accelerates GPU-enabled histogram generation by using multiple local histograms. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2015-HPC-150,
号 8,
p. 1-9,
発行日 2015-07-28
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
値 |
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |