Item type |
SIG Technical Reports(1) |
公開日 |
2018-02-21 |
タイトル |
|
|
タイトル |
有限要素法における係数行列生成部のマルチコア・メニィコア向け最適化 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Optimization of generation process for sparse coefficient matrices in FEM on multicore/manycore architectures |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
並列最適化 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学情報基盤センター/科学技術振興機構CREST |
著者所属 |
|
|
|
東京大学情報基盤センター/科学技術振興機構CREST |
著者所属 |
|
|
|
エヌビディア |
著者所属 |
|
|
|
東京大学情報基盤センター |
著者所属 |
|
|
|
東京大学情報基盤センター |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo / CREST, Japan Science and Technology Agency |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo / CREST, Japan Science and Technology Agency |
著者所属(英) |
|
|
|
en |
|
|
NVIDIA Corporation |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Information Technology Center, The University of Tokyo |
著者名 |
中島, 研吾
星野, 哲也
成瀬, 彰
塙, 敏博
三木, 洋平
|
著者名(英) |
Kengo, Nakajima
Tetsuya, Hoshino
Akira, Naruse
Toshihiro, Hanawa
Yohei, Miki
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
有限要素法は偏微分方程式のは値解法として広く計算科学 ・ 工学分野で使用されている.有限要素法では各要素における積分方程式から密な要素行列を生成し,それを重ね合わせて得られる疎な全体行列に境界条件を適用し,全体行列を係は行列とする連立一次方程式を解いて解を得る.要素行列 ・ 全体行列を生成する係は行列生成部は連立一次方程式求解と並んで時間を要するプロセスである.本研究では,Intel Xeon (Broadwell),Intel Xeon Phi (Knights Landing) および NVIDIA Tesla P100 (Pascal) 及び V100 (Volta) を対象としてそれぞれの特性を生かした最適化を実施した.本稿では最適化の詳細と性能評価結果について述べる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Finite Element Method (FEM) is widely used for solving Partial Differential Equations (PDE) in various types of applications of computational science and engineering. In FEM, dense element matrix is introduced based on integral equations for each element, and sparse global matrix is assembled from element matrices. Boundary conditions are applied to this global matrix, and derived linear equations are solved. This process for generation of element and global matrices and the sparse matrix solver are the most expensive procedures in FEM procedures. In the present work, the matrix assembly process is optimized on Intel Xeon Phi (Broadwell), Intel Xeon Phi (Knights Landing) and NVIDIA Tesla P100 (Pascal) and V100 (Volta) based on features of each architecture. The paper describes details of optimization and results of performance evaluation. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2018-HPC-163,
号 28,
p. 1-8,
発行日 2018-02-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |