WEKO3
アイテム
自動チューニング機構が並列数値計算ライブラリに及ぼす効果
https://ipsj.ixsq.nii.ac.jp/records/17848
https://ipsj.ixsq.nii.ac.jp/records/17848ef03a927-563c-41d5-bd80-4f2a9efc33a8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-11-15 | |||||||
タイトル | ||||||||
タイトル | 自動チューニング機構が並列数値計算ライブラリに及ぼす効果 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Impact of Auto - tuning Facilities for Parallel Numerical Library | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
日本学術振興会特別研究員/東京大学大学院理学系研究科情報科学専攻 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属 | ||||||||
東京大学大学院理学系研究科情報科学専攻/現在,信陽ビジネスサービス株式会社 | ||||||||
著者所属 | ||||||||
東京大学理学部情報科学科/現在,東京大学大学院情報理工学系研究科コンピュータ科学専攻 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センタースーパーコンピューティング研究部門 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Fellow of the Japan Society for the Promotin of Science/Department of Computer Science, Graduate School of Science, The University o Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Science, The University o Tokyo/Presently with Shinyo Business Service Co.,Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Facility of Science, The University of Tokyo/Presently with Department of Computer Science, Graduate School of Information Technology Science, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Centre Division, Information Technology Center, The University of Tokyo | ||||||||
著者名 |
片桐, 孝洋
黒田, 久泰
大澤, 清
工藤, 誠
金田, 康正
× 片桐, 孝洋 黒田, 久泰 大澤, 清 工藤, 誠 金田, 康正
|
|||||||
著者名(英) |
Takahiro, Katagiri
Hisayasu, Kuroda
Kiyoshi, Ohsawa
Makoto, Kudoh
Yasumasa, Kanada
× Takahiro, Katagiri Hisayasu, Kuroda Kiyoshi, Ohsawa Makoto, Kudoh Yasumasa, Kanada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 数値計算において高性能を達成するため,現在でも多くの技法を用いてチューニングがなされる.この作業自体が時間を浪費するものであったり,また利用する計算機に対する高度な知識が必要となる.本論文ではこのチューニング作業を自動化するため,並列数値計算ライブラリに自動チューニング機構を付加することを提案する.従来の機構との違いは,(1)分散メモリ型計算機を対象とする;(2)標準化された計算のみの最適化ではない;(3)ライブラリ全体の最適化が可能である;の3 点である.提案機構を付加した並列数値計算ライブラリILIB (Intelligent LIBrary )を,日立の分散メモリ型並列計算機HITACHI SR2201 ,HITACHI SR8000 で評価した.その結果,密行列LU 分解ルーチンでは理論性能に対して89%の効率,疎行列LU 分解ルーチンでは72%の効率という高い性能を達成した.また疎行列反復解法では,標準的にもちいられているパラメータに対する速度向上が52 倍にも及ぶことが明らかとなった.ブロック化アルゴリズムにおけるブロック幅といったような演算と通信に影響するパラメータも,ILIB では最適化可能である.このブロック幅の最適化の結果,2.3 倍の速度向上が得られる場合があった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To attain high performance in numerical computations,one has to tune one's programs by using several techniques.The tuning work is a time-consuming work,and it needs special knowledge of the target architectures.To automate the tuning work,we propose an auto-tuning facility for parallel numerical libraries in this paper.The different points between conventional facility and our facility are:(1)our facility focuses on distributed memory parallel machines;(2)our facility is not the limited optimization facility to standard computations; (3)our facility can optimize the all area of the target library.We evaluate the ILIB (Intelligent LIBrary)which contains the proposed auto-tuning facility on the HITACHI's distributed memory parallel machines of the HITACHI SR2201 and HITACHI SR8000.The evaluation shows that the ILIB can attain the efficiency of 89%in a dense LU decomposition routine and that of 72%in a sparse LU decomposition to theoretical peak performance.In the sparse iterative method routine,we obtained the speedup factor of 52 times in comparison with the execution time by the default parameters.On the other hand,the proposed facility can tune a block factor for blocked algorithm,which can affect computations and communications.For the optimization of the block factor,we found a case that the speed-up factor was 2.3 times. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11560614 | |||||||
書誌情報 |
情報処理学会論文誌ハイパフォーマンスコンピューティングシステム(HPS) 巻 42, 号 SIG12(HPS4), p. 60-76, 発行日 2001-11-15 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |