WEKO3
アイテム
CUDA環境における高性能3次元FFT
https://ipsj.ixsq.nii.ac.jp/records/18177
https://ipsj.ixsq.nii.ac.jp/records/181776324d1c0-ee7f-42a8-9018-e7f4ff0ff963
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2008-08-21 | |||||||
| タイトル | ||||||||
| タイトル | CUDA環境における高性能3次元FFT | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | High Performance 3-D FFT in CUDA Environment | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | GPU応用 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 東京工業大学 独立行政法人科学技術振興機構戦略的創造研究推進事業 | ||||||||
| 著者所属 | ||||||||
| 東京工業大学 独立行政法人科学技術振興機構戦略的創造研究推進事業 | ||||||||
| 著者所属 | ||||||||
| 東京工業大学 独立行政法人科学技術振興機構戦略的創造研究推進事業 | ||||||||
| 著者所属 | ||||||||
| 東京工業大学 独立行政法人科学技術振興機構戦略的創造研究推進事業 独立行政法人国立情報学研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Institute of Technology,Japan Science and Technology Agency, Core Research for Evolutional Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Institute of Technology,Japan Science and Technology Agency, Core Research for Evolutional Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Institute of Technology,Japan Science and Technology Agency, Core Research for Evolutional Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Institute of Technology,Japan Science and Technology Agency, Core Research for Evolutional Science and Technology,National Institute of Informatics | ||||||||
| 著者名 |
額田, 彰
尾形, 泰彦
遠藤, 敏夫
松岡, 聡
× 額田, 彰 尾形, 泰彦 遠藤, 敏夫 松岡, 聡
|
|||||||
| 著者名(英) |
Akira, Nukada
Yasuhiko, Ogata
Toshio, Endo
Satoshi, Matsuoka
× Akira, Nukada Yasuhiko, Ogata Toshio, Endo Satoshi, Matsuoka
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | NVIDIAの最新GPUがサポートするCUDA環境では共有メモリを用いたスレッド間のデータ共有と,自由度が高いメモリアクセスが可能である.我々はこのCUDA環境に適した高性能3次元FFTアルゴリズムを提案する.GeForce 8シリーズのGPUを用いた3次元FFTにおいて,CUFFTライブラリ1.1と比較して3.1∼3.3倍,最大79.5GFLOPSの演算性能を達成した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | CUDA environment, which is supported in latest NVIDIA GPUs, allows data sharing between threads using shared memory, and also provides more flexible memory accesses. We propose a high performance 3-D FFT algorithm for the CUDA environment. Using GeForce 8 series GPUs, we achieved a high performance up to 79.5GFLOPS at 3-D FFT, which is from 3.1 to 3.3 times the performance compared with the performance of CUFFT library 1.1. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11833852 | |||||||
| 書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 1, 号 2, p. 231-239, 発行日 2008-08-21 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7829 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||