@techreport{oai:ipsj.ixsq.nii.ac.jp:00102295, author = {大島聡史 and 松本正晴 and 片桐孝洋 and 塙敏博 and 中島研吾}, issue = {21}, month = {Jul}, note = {今日の HPC においては高い演算性能と低い消費電力を達成するために様々な並列計算ハードウェアが用いられている.CPU は微細化と消費電力の制限等によりマルチコア化が進み,現在では 1 ソケットあたり 10 前後のコアを搭載した CPU が多く用いられている.GPU は非常に多くの計算コアと高いピーク性能を備え,CPU と比べると適したアプリケーションが限られるものの,様々なシーンにおいて活用が進んでいる.メニーコアプロセッサは CPU と GPU それぞれのメリットを享受できるものとして注目が高まっている.一方で並列計算のためのプログラミング環境に着目すると,従来から使われている OpenMP や MPI の普及がますます進んでいる.さらに近年では従来の OpenMP では対応できなかった GPU プログラミングについても OpenMP のような指示文を用いた簡便な並列化プログラミングを可能にするべく,OpenMP 4.0 や OpenACC が策定され,対応するコンパイラもいくつか公開・販売され始めている.そこで本稿では,様々な計算機環境を対象として OpenMP や OpenACC を用いて同一の問題を実行し,性能やその傾向を調査し報告する.対象問題としては有限体積法アプリケーションにおける ICCG 法を用いる.対象とする並列計算ハードウェアは以下の通りである: Intel Xeon (IvyBridge-EP),AMD Opteron (Piledriver),富士通 SPARC64 IXfx,NVIDIA Tesla (Kepler),Intel Xeon Phi (Knights Corner).}, title = {様々な計算機環境におけるOpenMP/OpenACCを用いたICCG法の性能評価}, year = {2014} }