@techreport{oai:ipsj.ixsq.nii.ac.jp:00066873, author = {岩田, 健司 and 中村, 良介 and 田中, 良夫 and 増田, 知記 and 町田, 亮介 and 小島, 功 and 関口, 智嗣 and Kenji, Iwata and Ryosuke, Nakamura and Yoshio, Tanaka and Tomoki, Masuda and Ryosuke, Machida and Isao, Kojima and Satoshi, Sekiguchi}, issue = {3}, month = {Nov}, note = {マルチコアによる並列化手法とその効果は数多く報告されているが,応用場面によりそのアプローチは異なり,また精度を十分に担保する必要がある.この論文では,DEM (数値標高モデル) 生成を対象とし,異なるアーキテクチャのマルチコアプロセッサに対し高速化を行い,その性能を評価する.DEM 生成は主に,テンプレートマッチング,異常値内挿,メディアンフィルタといった並列化可能な処理で構成されている.並列化に加え,アルゴリズム面においても十分な精度を確保できた上で,ZNCC 再帰演算や census 変換法など高速な手法を導入した.ヘテロジニアスマルチコアである IBM PowerXCell 8i においては,SPE における DMA 転送の最適化などにより,約 350 倍に高速化された.ホモジニアスマルチコアである Intel Xeon においては,OpenMP による並列化や高速アルゴリズムの導入により,約 38 倍に高速化された., Many approaches of parallelization on multi-core is reported, but the approach should differ by application and guaranteed accuracy enough. This paper described that the acceleration of DEM (Digital Elevation Model) generation on different architecture of multi-core is evaluated. The DEM generation composed of the template matching, interpolation and median filter. The recursive ZNCC calculation and the census transform, etc. was implemented for acceleration with guaranteed accuracy. The optimizaion on heterogeneous multi-core (IBM PowerXCell 8i) was sped up by about 350 times by optimizing the DMA transfer in SPE . The optimizaion on homogeneous multi-core (Intel Xeon) was sped up by about 38 times by using OpenMP and the high-speed algorithm.}, title = {ホモジニアス・ヘテロジニアスマルチコアによるDEM生成の高速化と性能評価}, year = {2009} }