WEKO3
アイテム
GPGPUのシェアードメモリを利用する自動最適化機構
https://ipsj.ixsq.nii.ac.jp/records/94642
https://ipsj.ixsq.nii.ac.jp/records/946420dd666a3-660c-4d1f-8deb-8f5df04c29ca
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-07-24 | |||||||
タイトル | ||||||||
タイトル | GPGPUのシェアードメモリを利用する自動最適化機構 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Optimization Scheme using Shared Memory in GPGPU | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | GPU・メニーコアコンピューティング | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
三重大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
三重大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
三重大学大学院工学研究科/現在,株式会社医用工学研究所 | ||||||||
著者所属 | ||||||||
三重大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mie University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mie University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mie University / Presently with Medical Engineering Institute, Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mie University | ||||||||
著者名 |
神谷, 智晴
丸山, 剛寛
松本, 真樹
大野, 和彦
× 神谷, 智晴 丸山, 剛寛 松本, 真樹 大野, 和彦
|
|||||||
著者名(英) |
Tomoharu, Kamiya
Takanori, Maruyama
Masaki, Matumoto
Kazuhiko, Ohno
× Tomoharu, Kamiya Takanori, Maruyama Masaki, Matumoto Kazuhiko, Ohno
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,GPU 上で汎用計算を実行する GPGPU が注目されている.現在主流な開発環境である CUDA では,高級言語で記述することが可能だが,GPU の複雑なメモリ構造を意識してプログラミングする必要がある.これに対し,我々は単純なメモリ構造モデルでプログラミング可能な MESI-CUDA を提案している.しかし,現在の MESI-CUDA が生成するコードはプログラマが手動最適化した CUDA コードと比べて実行時間が長くなることがある.そこで,我々は MESI-CUDA 上に,メモリアクセスレイテンシの短いシェアードメモリを自動で使用する機構を実現した.本手法では,シェアードメモリに格納するデータ選出のため静的解析により各データのアクセス頻度を求める.続いて解析結果を元にデータのシェアードメモリへのコピーコードを挿入し,アクセス先の変数名と配列インデックスの書き換えを行う.提案手法適用の有無によるプログラムの実行時間を比較して評価を行った結果,本機構により実行時間を最大約 1/3 まで短縮できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The performance of Graphics Processing Units (GPU) is improving rapidly. Thus, General Purpose computation on Graphics Processing Units (GPGPU) is expected as an important method for high-performance computing. Major developing environment, such as CUDA, enables GPU programming using C, but the user must handle the complicated memory architecture. Therefore, we are developing a new programming framework named MESI-CUDA, which provides a simple memory architecture model automatically generating low-level CUDA code. The current implementation of MESI-CUDA may generate inefficient code compared with the hand-optimized CUDA program, because the auto-generated code only uses the global memory of GPU. Thus, we propose a scheme which automatically generates code using the fast shared memories on GPU. Using static analysis, our scheme estimates the access frequency of arrays and determines which array should be cached on the shared memories. Then the target code is modified to copy the array to the shared memories. The code accessing the array is also modified to access the copy. The evaluation result shows that using our scheme, the execution time is reduced to 1/3 at maximum. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2013-HPC-140, 号 30, p. 1-8, 発行日 2013-07-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |