| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-08-01 |
| タイトル |
|
|
タイトル |
タスクの依存性を用いたOpenMPプログラムのNUMA最適化 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
並列処理 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
理化学研究所計算科学研究機構 |
| 著者所属 |
|
|
|
筑波大学 |
| 著者所属 |
|
|
|
理化学研究所計算科学研究機構 |
| 著者所属 |
|
|
|
理化学研究所計算科学研究機構/筑波大学 |
| 著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
| 著者所属(英) |
|
|
|
en |
|
|
University of Tsukuba |
| 著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science |
| 著者所属(英) |
|
|
|
en |
|
|
RIKEN Advanced Institute for Computational Science / University of Tsukuba |
| 著者名 |
李, 珍泌
津金, 佳祐
村井, 均
佐藤, 三久
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
現在の多くの高性能計算機システムにおいて,プロセッサのコア数の増加に伴い,NUMA アーキテクチャの普及および複雑化が進んでいる.最新の Intel プロセッサなどは一つのチップの中でも複数の NUMA ノードを持つアーキテクチャが登場し,それを使いこなす並列プログラミング手法が求められている.OpenMP の仕様の発展によりループ文のワークシェアリングなどによるデータ並列化においては NUMA アーキテクチャを使いこなす技法が整備されつつあるが,task 指示文などによるタスク並列化においてはまだメモリ局所化を明示的に意識したプログラミングができない.本研究では OpenMP 4.0 から導入された task 指示文の depend 節を用いて NUMA ノードの判定を行うことでプログラマが NUMA ノードを意識したタスク並列化を記述できるように GCC OpenMP ランタイムの拡張を行った.データ初期化時に NUMA API を用いた明示的なメモリ割り当てを行い,ランタイムによってタスクの実行ノードをメモリ割り当てに合わせることで無用なノード間のメモリ転送を減らし,並列性能を向上させる.KASTORS ベンチマークを用いた性能評価の結果,memory-intensive な Jacobi カーネルの場合,元の GCC コンパイラに比べて 2 倍の性能向上が得られた. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2016-HPC-155,
号 25,
p. 1-7,
発行日 2016-08-01
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |