ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2016
  4. 2016-HPC-155

単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討

https://ipsj.ixsq.nii.ac.jp/records/174161
https://ipsj.ixsq.nii.ac.jp/records/174161
b895e08f-56ba-4372-b77f-b50874b7feff
名前 / ファイル ライセンス アクション
IPSJ-HPC16155047.pdf IPSJ-HPC16155047.pdf (303.0 kB)
Copyright (c) 2016 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2016-08-01
タイトル
タイトル 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討
タイトル
言語 en
タイトル A Preliminary Method for Multi-dimensional Data Decomposition for Executing a Single-GPU code on Multi-GPU Environments
言語
言語 jpn
キーワード
主題Scheme Other
主題 データレイアウト
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
大阪大学大学院情報科学研究科コンピュータサイエンス専攻
著者所属
大阪大学大学院情報科学研究科コンピュータサイエンス専攻
著者所属
大阪大学大学院情報科学研究科コンピュータサイエンス専攻
著者所属(英)
en
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University
著者所属(英)
en
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University
著者所属(英)
en
Department of Computer Science, Graduate School of Information Science and Technology, Osaka University
著者名 酒井, 亮太郎

× 酒井, 亮太郎

酒井, 亮太郎

Search repository
伊野, 文彦

× 伊野, 文彦

伊野, 文彦

Search repository
萩原, 兼一

× 萩原, 兼一

萩原, 兼一

Search repository
著者名(英) Ryotaro, Sakai

× Ryotaro, Sakai

en Ryotaro, Sakai

Search repository
Fumihiko, Ino

× Fumihiko, Ino

en Fumihiko, Ino

Search repository
Kenichi, Hagihara

× Kenichi, Hagihara

en Kenichi, Hagihara

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,単一 GPU(Graphics Processing Unit) 向けに記述された CUDA(Compute Unified Device Architecture) コードを,マルチ GPU 上で加速するための多次元データ分割手法を検討する.我々の手法は,1 次元データ向けの既存手法の拡張であり,一部のスレッドのサンプリング実行に基づいて GPU メモリに格納しきれない大規模な多次元データを小さなセグメントに分割する.既存手法と比較して,提案手法は小さなセグメントサイズを実現し,GPU メモリの使用量を節約するとともに,CPU・GPU 間のデータ転送量を削減する.行列積を用いた予備実験の結果,提案手法は既存手法よりも GPU メモリ使用量を 80%削減し,CPU メモリに収まる程度の大規模行列を正しく処理できた.しかし,データ分割に起因するインデックス変換が実効性能を 27%低下させることが分かった.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we present a preliminary method for multi-dimensional data decomposition, aiming at realizing multi-GPU acceleration of the compute unified device architecture (CUDA) code written for a single graphics processing unit (GPU). Our method, namely an extension of a previous method that deals with one-dimensional data, performs a sampling run of selected threads to generate small segments by decomposing large data that cannot be stored entirely in GPU memory. As compared with the previous method, our method realizes smaller segment size, so that it saves the usage of GPU memory and reduces the amount of CPU-GPU data transfer. As a result of preliminary experiments using matrix multiplication, the presented method reduced the usage of GPU memory by 80%, and thereby correctly processed large matrices that can be stored in CPU memory. However, we found that index translation needed for data decomposition dropped the effective performance by 27%.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2016-HPC-155, 号 47, p. 1-7, 発行日 2016-08-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8841
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 07:01:54.061912
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3