Item type |
SIG Technical Reports(1) |
公開日 |
2018-07-23 |
タイトル |
|
|
タイトル |
三重対角化におけるメニーコア環境に適した同期手法 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
数値計算 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
理化学研究所計算科学研究センター |
著者所属 |
|
|
|
理化学研究所計算科学研究センター |
著者所属(英) |
|
|
|
en |
|
|
R-CCS |
著者所属(英) |
|
|
|
en |
|
|
R-CCS |
著者名 |
工藤, 周平
今村, 俊幸
|
著者名(英) |
Shuhei, Kudo
Toshiyuki, Imamura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
対称行列の三重対角化は固有値計算の前処理として利用される行列計算である.しかし,計算の大部分が逐次的な対称行列ベクトル積となっているため, B / F 値が高いだけでなく,同期のオーバーヘッドが大きいため高性能化が難しい.発表者はストリーム数を減らすデータ配置と,データ再利用性を高めるためのループ融合手法を用いることで,京コンピュータの単体ノード向けにチューニングした三重対角化ライブラリを開発し公開しているが,これは,京コンピュータに特化しているため,現在の多数のコアを持ち高いスレッド並列性が要求される計算機においては十分な性能を出せないものとなっていた.そこで,現在のマルチコア ・ メニーコア CPU における同期の問題へ対応するため,対称行列ベクトル積に出現するコア間総和処理に適した同期手法を開発した.この結果,Intel のメニーコア CPU Xeon Phi (Knights Landing) 上で,行列サイズ 5,000 程度の大きさにおいても Intel MKL の 2 倍以上となる高い性能を実現している.本発表ではこの同期手法について解説し,データ配置やブロックサイズなどを変化させたときの詳細な性能測定結果を示す.また,内部的に特別なデータ配置を用いる行列計算ライブラリの応用について議論する. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2018-HPC-165,
号 33,
p. 1-8,
発行日 2018-07-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |