ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2011
  4. 2011-HPC-130

SPECベンチマークプログラムのCUDAによる並列化の検討

https://ipsj.ixsq.nii.ac.jp/records/75557
https://ipsj.ixsq.nii.ac.jp/records/75557
409537e7-a041-4902-a907-26d0f12d22a6
名前 / ファイル ライセンス アクション
IPSJ-HPC11130016.pdf IPSJ-HPC11130016.pdf (728.5 kB)
Copyright (c) 2011 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2011-07-20
タイトル
タイトル SPECベンチマークプログラムのCUDAによる並列化の検討
タイトル
言語 en
タイトル Examination of Parallelization by CUDA in SPEC benchmark program
言語
言語 jpn
キーワード
主題Scheme Other
主題 GPU
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
早稲田大学
著者所属
早稲田大学
著者所属
早稲田大学
著者所属(英)
en
Waseda University
著者所属(英)
en
Waseda University
著者所属(英)
en
Waseda University
著者名 平, 勇樹 木村, 啓二 笠原, 博徳

× 平, 勇樹 木村, 啓二 笠原, 博徳

平, 勇樹
木村, 啓二
笠原, 博徳

Search repository
著者名(英) Yuki, Taira Keiji, Kimura Hironori, Kasahara

× Yuki, Taira Keiji, Kimura Hironori, Kasahara

en Yuki, Taira
Keiji, Kimura
Hironori, Kasahara

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,GPU を汎用的な科学計算に用いる手法である GPGPU が注目されている.GPU は CPU と比べて高速な演算性能を持っているが,GPU の高い並列性を生かすためには並列性を持ったプログラムの選択と最適化が不可欠である.Doall のような単純な計算においては性能を出しやすいが,漸化計算 (Reduction) のような並列性が低くなる計算では最適化を行わなければ性能を生かし切ることが出来ない.本研究報告では,並列性の高い汎用 SMP 用ベンチマークである SPEC OMPL2001 331.art を評価対象とし,最適化によって GPU の性能がどれほど得られ,データサイズによってどれほど性能向上の差があるかを調査する.GPGPU のための並列アーキテクチャ CUDA を用いてベンチマークプログラム 331.art を最適化し評価を行ったところ,12 コアでの並列実行の総計算時間と比べて 1.90 倍の速度向上を得た.また,配列サイズが 200 万個以上の漸化計算であればデータ転送帯域を有効に使うことが出来,CPU での並列実行より高速に動作させられることが確認できた.
論文抄録(英)
内容記述タイプ Other
内容記述 Recently, GPGPU which means a technique of General Purpose computing on GPU has attracted attention. GPU has a high-speed computing performance compared with CPU. Although in order to utilize a high parallelism that GPU have well, it is necessary to select a program with parallelism and optimize the program. It is easy to give high performance in the simple calculation such as Doall, but cannot make use of performance if you don't optimize a low parallelism compute such as Reduction. In this paper, we set a target for SPEC OMPL2001 331.art which has high parallelism and evaluate how much performance is provided by GPU optimize and evaluate how much difference will appear by changing data size of arrays. In this paper, we got speed-up of 1.90 times compared with the total calculation time of parallel execution in 12 cores. We can execute faster than parallel execution in 12 cores when we set a target as a Reduction which access to 2 Million data array.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2011-HPC-130, 号 16, p. 1-6, 発行日 2011-07-20
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 21:09:10.929541
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3