WEKO3
アイテム
自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
https://ipsj.ixsq.nii.ac.jp/records/69672
https://ipsj.ixsq.nii.ac.jp/records/6967281183631-98ae-408d-9d8f-cd3f038bdd69
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-06-10 | |||||||
タイトル | ||||||||
タイトル | 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Sparse Matrix-Vector Multiplication Algorithm for Auto-Tuning Interface “OpenATLib” | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算と自動チューニング | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日立製作所中央研究所 | ||||||||
著者所属 | ||||||||
日立製作所中央研究所 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
愛媛大学大学院理工学研究科/東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
日立超LSIシステムズ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Central Research Laboratory, Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Central Research Laboratory, Hitachi, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Supercomputing Research Division, Information Technology Center, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Supercomputing Research Division, Information Technology Center, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Ehime University / Supercomputing Research Division, Information Technology Center, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi ULSI Systems Co., Ltd. | ||||||||
著者名 |
櫻井, 隆雄
× 櫻井, 隆雄
|
|||||||
著者名(英) |
Takao, Sakurai
× Takao, Sakurai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 自動チューニングの実装の再利用性を実現するため,筆者らは自動チューニングインターフェース OpenATLib を提案している.本稿では OpenATLib の提供する機能の 1 つである疎行列ベクトル積の備える 7 種のアルゴリズム (対称向け 3 種,非対称向け 4 種) について述べる.各アルゴリズムは単体実行向けや並列環境向けに最適化されており,与えられた行列や実行環境により最も高い性能が得られるアルゴリズムが自動的に選択される.T2K オープンスパコン (東大版) 1 ノード (16 コア) 上で様々なフロリダ大の行列を用いて各アルゴリズムを比較した.その結果,16 コア環境において対称向けアルゴリズムで最大 12.7 倍,非対称向けアルゴリズムで最大 2.5 倍の性能差があり,アルゴリズムの自動選択機能が有効であるとわかった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We proposed Auto-tuning interface “OpenATLib” to realize reusability for implementation of Automatic Tuning facility (RIAT) on numerical libraries. In this paper, we developed 7 kinds of sparse matrix vector multiplication algorithms for OpenATLib (3 kinds for symmetric matrices and 4 kinds for unsymmetric matrices). By auto-tuning method, the best algorithm is selected for input matrices and execution environment. Performance evaluation of OpenATLib using several U. Florida matrices on T2K Open Supercomputer (U. Tokyo Combined Cluster) on 1 node (16 cores) indicated that the maximum speedup established 12.7x (for symmetric) and 2.5x (for unsymmetric). | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2010-HPC-125, 号 2, p. 1-8, 発行日 2010-06-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |