@techreport{oai:ipsj.ixsq.nii.ac.jp:00177923, author = {星野, 哲也 and 大島, 聡史 and 塙, 敏博 and 中島, 研吾 and 伊田, 明宏}, issue = {18}, month = {Mar}, note = {不完全コレスキー分解前処理付き共役勾配法 (ICCG 法) は,疎行列連立一次方程式の解法として,科学技術計算において広く使用されている.ICCG 法はデータ依存性を有する計算過程を含むため,並列計算を行うためには多色順序付け等により並列性を抽出する必要があるが,最適な色付け手法・行列格納形式は,実行する並列計算デバイスにより大きく異なることが知られている.本研究では,OpenACC を用いて ICCG 法ソルバーを並列化し,NVIDIA 社の最新の Pascal 世代の GPU (P 100) 向けの最適化 ・ 性能評価を実施し,同世代のメニーコアプロセッサである Intel Xeon Phi (Knights Landing) 等と比較評価を行なった結果について報告する.}, title = {OpenACCを用いたICCG法ソルバーのPascal GPUにおける性能評価}, year = {2017} }