WEKO3
アイテム
Many Integrated Core architectureにおける倍々精度疎行列ベクトル積
https://ipsj.ixsq.nii.ac.jp/records/102290
https://ipsj.ixsq.nii.ac.jp/records/1022900675ef6a-05f3-4d7d-a42b-65d950071d58
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-07-21 | |||||||
タイトル | ||||||||
タイトル | Many Integrated Core architectureにおける倍々精度疎行列ベクトル積 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 高性能計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
工学院大学 | ||||||||
著者所属 | ||||||||
工学院大学 | ||||||||
著者所属 | ||||||||
工学院大学 | ||||||||
著者所属 | ||||||||
工学院大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kogakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kogakuin University | ||||||||
著者名 |
佐々木信一
× 佐々木信一
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | MIC(Many Integrated Core Architecture) のようなメモリ性能に対して演算器性能が十分に高いアーキテクチャではその演算能力を高精度演算に割くことが可能である.高精度演算は演算時間が長いため,倍々精度と呼ばれる倍精度変数 2 つを組み合わせて 1 つの四倍精度変数の値を保持する高速な演算手法がある.本研究では,MIC 向けに SIMD を用いて倍精度疎行列と倍々精度ベクトルの積を実装し,疎行列の格納形式の違いから性能決定の要因を検証した.疎行列の格納形式である CRS 形式と BCRS 形式を対比させながらメモリアクセスや計算量,列あたりの平均ブロックヒット数,並列化時の AFFINITY と SCHEDULE について検証し,条件の良い問題では BCRS 形式は CRS 形式に対して 17 倍の性能を示した.特にブロックヒット数が性能を決める大きな要因であり,ブロックヒット数が 1.9 以上の時は BCRS 形式,1.9 未満の時は CRS 形式を用いることで多くの疎行列にて高い性能を示すことを明らかにした. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2014-HPC-145, 号 16, p. 1-7, 発行日 2014-07-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |