WEKO3
アイテム
高精度行列‐行列積アルゴリズムのスレッド並列化とABCLibScriptへの機能実装
https://ipsj.ixsq.nii.ac.jp/records/81361
https://ipsj.ixsq.nii.ac.jp/records/813618697caac-e008-4c90-b82a-3062e15b2877
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-03-19 | |||||||
タイトル | ||||||||
タイトル | 高精度行列‐行列積アルゴリズムのスレッド並列化とABCLibScriptへの機能実装 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Thread Parallelization to Accuracy Guaranteed Matrix-Matrix Multiplication and Implementation of Its Function to ABCLibScript | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 四倍精度・多倍長 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属 | ||||||||
芝浦工業大学システム理工学部 | ||||||||
著者所属 | ||||||||
東京女子大学現代教養学部 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Center, The University of Tokyo. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of System Engineering and Science, Shibaura Institute of Technology. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Division of Mathematical Science, Tokyo Woman's Christian University. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Engineering, Waseda University. | ||||||||
著者名 |
片桐, 孝洋
× 片桐, 孝洋
|
|||||||
著者名(英) |
Takahiro, Katagiri
× Takahiro, Katagiri
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 行列-行列積に代表される基本線形計算を集約したライブラリ BLAS (Basic Linear Algebra Subprograms) は,多くの線形計算で必須の処理である.従来の数値計算ライブラリは,演算速度は考慮しているが演算精度の考慮が不十分であり,解の精度保証が重要な課題となっている.本研究では,大石グループで開発された高精度行列-行列演算に 2 種のスレッド並列化を行った.予備評価の結果,並列処理の規模に応じ並列化方式を切り替える必要があることが判明した.また,その切り替えを実現できる自動チューニング (AT)を,AT 言語の ABCLibScript を用いて実現した.T2K オープンスパコン (1 ノード,16 スレッド) を用いた性能評価の結果,AT による並列化方式の切り替えで最大で 5 倍程度の速度向上を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | BLAS (Basic Linear Algebra Subprograms), including matrix-matrix multiplication, is a crucial numerical library for many linear algebra computations. However, conventional numerical libraries are not enough taking into account for computing accuracy, while they are optimized for execution speed. Guaranteeing computational accuracy is one of important topics. In this research we parallelize an accuracy guaranteed matrix-matrix multiplication algorithm proposed by Oishi group by utilizing two kinds of thread implementations. As a result of preliminary evaluation, we found that selecting parallel method according to the number of threads is critical. In addition we adapt an auto-tuning (AT) language to establish the selection by using ABCLibScript. As a result of performance evaluation on the T2K open supercomputer (1 node, 16 threads), we obtained maximum 5x speedup by using the AT. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2012-HPC-133, 号 26, p. 1-8, 発行日 2012-03-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |