WEKO3
アイテム
動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化
https://ipsj.ixsq.nii.ac.jp/records/78060
https://ipsj.ixsq.nii.ac.jp/records/780609ad1e7c6-65f2-40bc-969f-13cf1659dd25
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2011-10-05 | |||||||
| タイトル | ||||||||
| タイトル | 動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Performance Optimization for the Blocked Householder QR Decomposition Using the Dynamic Programming | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 自動チューニング | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 名古屋大学大学院工学研究科計算理工学専攻 | ||||||||
| 著者所属 | ||||||||
| 神戸大学大学院システム情報学研究科計算科学専攻 | ||||||||
| 著者所属 | ||||||||
| 名古屋大学大学院工学研究科計算理工学専攻 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computational Science, Graduate School of System Informatics, Kobe University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Computational Science and Engineering, Graduate School of Engineering, Nagoya University | ||||||||
| 著者名 |
深谷, 猛
山本, 有作
張, 紹良
× 深谷, 猛 山本, 有作 張, 紹良
|
|||||||
| 著者名(英) |
Takeshi, Fukaya
Yusaku, Yamamoto
Shao-Liang, Zhang
× Takeshi, Fukaya Yusaku, Yamamoto Shao-Liang, Zhang
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 密行列計算においては,高性能化のためにアルゴリズムのブロック化が必須である.その際に,ブロック化の方法次第で性能が大きく変化するため,その最適化が重要な課題となっている.しかしながら,ブロック化の自由度が大きいため,従来は限定された範囲内で最適化を行うことがほとんどである.本論文では,QR 分解アルゴリズムを対象として,二分木を使うことで従来より格段に広いクラスのブロック化の方法を系統的に扱い,その中から動的計画法により最適なブロック化の方法を決定する手法を提案する.数値実験の結果,提案手法がブロック分割法に対する自動チューニング手法として有望であることが示された. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Blocking techniques are widely used in high performance matrix computations. When using them, it is important to optimize a blocking way, which influences the performance of computations. However, because of the high degree of freedom in blocking techniques, such optimization is generally done in a limited class of blocking ways. In this paper, we propose a framework to determine the efficient blocking way for the algorithm of QR decomposition. In our framework, various kinds of blocking ways are represented systematically with binary trees and an optimal one is determined by dynamic programming. Results of numerical experiments show that our framework has good possibilities in the view of the automatic performance tuning. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11833852 | |||||||
| 書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 4, 号 4, p. 146-157, 発行日 2011-10-05 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7829 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||