WEKO3
アイテム
PCクラスタにおける並列一次元FFTのブロックアルゴリズム
https://ipsj.ixsq.nii.ac.jp/records/17833
https://ipsj.ixsq.nii.ac.jp/records/1783304dcdadd-6cb5-4893-86d9-ceb48b5df1c5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-09-15 | |||||||
タイトル | ||||||||
タイトル | PCクラスタにおける並列一次元FFTのブロックアルゴリズム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Blocking Algorithm for Parallel 1 - D FFT on Clusters of PCs | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 並列処理応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者名 |
高橋, 大介
× 高橋, 大介
|
|||||||
著者名(英) |
Daisuke, Takahashi
× Daisuke, Takahashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,PC クラスタにおける並列一次元FFT のブロックアルゴリズムを提案する.提案する並列一次元FFT アルゴリズムは,six-step FFT アルゴリズムに基づいている.キャッシュミスの回数を減らすために,six-step FFT アルゴリズムはブロックnine-step FFT に変更することができる.このブロックnine-step FFT アルゴリズムではキャッシュメモリを効果的に利用することにより,性能が改善されることを示す.ブロックnine-step FFT アルゴリズムに基づいて,並列一次元FFT をdual Pentium III PC SMP クラスタに実装し,性能評価を行った.その結果,8 ノードのdual Pentium III 1 GHz PC SMP クラスタでは1. 3 GFLOPS を超える性能を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a blocking algorithm for a parallel one-dimensional fast Fourier transform (FFT)on clusters of PCs. Our proposed parallel FFT algorithm is based on the six-step FFT algorithm. The six-step FFT algorithm can be altered into a block nine-step FFT algorithm to reduce the number of cache misses. The block nine-step FFT algorithm improves performance by utilizing the cache memory effectively. We use the block nine-step FFT algorithm to design the parallel one-dimensional FFT algorithm. We successfully achieved performance of over 1. 3 GFLOPS on an 8-node dual Pentium III 1 GHz PC SMP cluster. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11560614 | |||||||
書誌情報 |
情報処理学会論文誌ハイパフォーマンスコンピューティングシステム(HPS) 巻 43, 号 SIG06(HPS5), p. 134-142, 発行日 2002-09-15 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |