WEKO3
アイテム
共有メモリ環境上でのタイルQR分解のタイルサイズチューニング
https://ipsj.ixsq.nii.ac.jp/records/145104
https://ipsj.ixsq.nii.ac.jp/records/145104dad83f7e-d1f2-4e96-a573-31cfae8d6149
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2015-09-23 | |||||||
タイトル | ||||||||
タイトル | 共有メモリ環境上でのタイルQR分解のタイルサイズチューニング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Tile Size Tuning for Tile QR Decomposition on Shared Memory Systems | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | アルゴリズムと性能 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
山梨大学大学院総合研究部工学域 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Interdisciplinary Research, Division of Engineering, University of Yamanashi | ||||||||
著者名 |
鈴木, 智博
× 鈴木, 智博
|
|||||||
著者名(英) |
Tomohiro, Suzuki
× Tomohiro, Suzuki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 高並列環境向きの行列分解アルゴリズムとして注目されているタイルアルゴリズムでは,問題サイズや実行環境に応じて適切なタイルサイズを選択することが非常に重要である.タイルサイズを小さくすることで,並列環境に応じた数のタスクを生成できるので負荷分散が行えるが,データサイズの低下に伴う L3 BLAS 性能の低下が起こる.つまり,環境に応じた十分な数のタスク数を供給しつつ,最大のタイルサイズを見つけることが求められる.今回,Agullo 等が提案した枝刈り探索に,生成するタスク数の基準を加えたものを使用してタイル QR 分解のタイルサイズチューニングを行った.共有メモリ環境上で行ったチューニングの結果を報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The tile algorithms are attracting the HPC community's attention as the suitable method for a highly parallel environment. For this algorithm, it is important to select the appropriate tile size corresponding to a problem size and a run-time environment. With a smaller tile size, we can generate as many tasks as available parallel computing resources. However, it leads the performance decline of L3 BLAS routines in the implementation. The maximum tile size, which can provide the enough number of tasks is required. In order to select such tile size, we carried out the parameter tuning by using the criterion of the number of tasks in addition to the pruned search introduced by Agullo et al. In this report, we show the result of tile size tuning and the performance of the tile QR decomposition on the shared memory systems. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2015-HPC-151, 号 21, p. 1-7, 発行日 2015-09-23 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8841 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |