ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. コンピューティングシステム(ACS)
  3. Vol.45
  4. No.SIG6(ACS6)

OpenMPを用いた帯行列に対する直接解法の並列化

https://ipsj.ixsq.nii.ac.jp/records/18484
https://ipsj.ixsq.nii.ac.jp/records/18484
5b24b74f-76a7-481b-ae97-c77a084f71f6
名前 / ファイル ライセンス アクション
IPSJ-TACS4506010.pdf IPSJ-TACS4506010.pdf (138.6 kB)
Copyright (c) 2004 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2004-05-15
タイトル
タイトル OpenMPを用いた帯行列に対する直接解法の並列化
タイトル
言語 en
タイトル Parallelization for Band Gaussian Elimination with OpenMP
言語
言語 jpn
キーワード
主題Scheme Other
主題 数値計算
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
筑波大学図書館情報学系
著者所属(英)
en
Institute of Library and Information Science, University of Tsukuba
著者名 長谷川, 秀彦

× 長谷川, 秀彦

長谷川, 秀彦

Search repository
著者名(英) Hidehiko, Hasegawa

× Hidehiko, Hasegawa

en Hidehiko, Hasegawa

Search repository
論文抄録
内容記述タイプ Other
内容記述 帯行列に対する直接解法は数値シミュレーションの核となる処理であるが,アルゴリズムの性格上,並列化効果が現れにくい.本報告では帯行列に対する直接解法がいろいろな共有メモリ方式の並列計算環境でどのような振舞いを示すかを明らかにするため,Pentium IIIからなるSMP,スーパコンピュータの1ノード,cc-NUMAによる並列コンピュータを用いて測定・評価を行った.その結果,OpenMPを用いた並列化は少ない手間で良好な性能が得られること,問題が細分化されることでメモリへの負荷が軽減されて性能劣化を遅らせられる効果があることが分かった.適切な解法アルゴリズムの選択,問題サイズと計算環境に応じたスレッド数の選択も重要である.また,アンローリングなどの従来からの高速化手法も有効で,OpenMPによる並列化と共存できることも明らかになった.最終的にItanium2(1.3 GHz)8CPUで,帯半幅500,次元数250 000の方程式のLU分解が40秒,求解が4秒でできる.対称正定値問題なら,分解が10秒,求解が1秒である.
論文抄録(英)
内容記述タイプ Other
内容記述 We applied some tuning and parallelization methods for some Gaussian Elimination solvers for the band matrices with OpenMP, and measured their performance on some latest parallel computing environments. The storing method and band algorithm let us difficult to tune and parallelize them. From the measurement the parallelization using OpenMP was effective on some shared-memory parallel computing environments. Especially on the Symmetric MultiProcessor, it reduces the load to the memory system, then may show a high parallel performance ratio larger than the number of CPUs. Finally we conclude that the parallelization using OpenMP is very cost-effective for the Gaussian Elimination solvers to the band matrices.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11833852
書誌情報 情報処理学会論文誌コンピューティングシステム(ACS)

巻 45, 号 SIG06(ACS6), p. 86-94, 発行日 2004-05-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7829
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 22:43:32.345638
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3