WEKO3
アイテム
SMPクラスタにおけるコレスキー分解の並列化
https://ipsj.ixsq.nii.ac.jp/records/29631
https://ipsj.ixsq.nii.ac.jp/records/296313e9873c9-e6d8-4238-b21e-2dbf56e049da
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-10-09 | |||||||
タイトル | ||||||||
タイトル | SMPクラスタにおけるコレスキー分解の並列化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Parallel Cholesky Factorization on a SMP Cluster | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属 | ||||||||
新情報処理開発機構つくば研究センタ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tsukuba Research Center, Real World Computing Partnership | ||||||||
著者名 |
佐藤, 茂久
× 佐藤, 茂久
|
|||||||
著者名(英) |
Shigehisa, Satoh
× Shigehisa, Satoh
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | SPLASH2の中のCholeskyを、Solarisスレッドとリモートメモリ転送を用いて並列化し、SMPクラスタCOMPaS上で性能を評価した。COMPaSは4個のPentiumProを持つノードをMyrinetを用いて8台接続している。ノード内の並列処理はSolarisスレッドを用いて行ない、ノード間の並列処理はMyrinetを通したリモートメモリ転送を行なうSPMD方式で実現した。Choleskyは疎行列のコレスキー分解を行なうプログラムで、不規則に通信が発生し、グローバルな同期を持たないという特徴を持つ。同数のプロセッサを持つ分散メモリシステムとSMPクラスタでは、後者の方がデータ共有のオーバーヘッドは小さくなるが、Choleskyの場合、負荷の不均衡による性能の低下が大きかった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have parallelized Cholesky in the SPLASH-2 suite using Solaris threads and remote memory operations, and evaluated the pedormance on a SMP Cluster COMPaS. COMPaS consists of eight SMP nodes connected by Myrinet, where each node has four Pentium Pro processors. Cholesky is a sparse cholesky factorization kernal which is characterized by high communication to computation ratio and no global synchronization between steps. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 1998, 号 93(1998-HPC-073), p. 49-54, 発行日 1998-10-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |