WEKO3
アイテム
線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行
https://ipsj.ixsq.nii.ac.jp/records/23634
https://ipsj.ixsq.nii.ac.jp/records/23634ab01c3ba-a3a9-4bc0-86ae-f4edc1686bf3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-03-08 | |||||||
タイトル | ||||||||
タイトル | 線形回帰演算の並列化手法の応用によるDOACROSSループの並列実行 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Bulk Recurrent Parallel Execution of DOACROSS Loops | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
広島市立大学情報科学部 | ||||||||
著者所属 | ||||||||
広島市立大学情報科学部 | ||||||||
著者所属 | ||||||||
広島市立大学情報科学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Sciences, Hiroshima City University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Sciences, Hiroshima City University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Sciences, Hiroshima City University | ||||||||
著者名 |
川端, 英之
× 川端, 英之
|
|||||||
著者名(英) |
Hideyuki, Kawabata
× Hideyuki, Kawabata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、ループ運搬依存を含むループ(DOACROSSループ)の並列化に、線形回帰演算の並列化手法を応用する方法について述べる。本手法は、ループのイタレーションの一つ一つを回帰演算の処理単位とみなして線形回帰演算の並列化手法を適用するものである。従来のループ並列化手法とは異なり、ループ全体から並列実行可能な成分を切り分けないため、ループインスタンス内に自然に存在しているデータ局所性が乱されない。アルゴリズム変換により総計算量が増加するものの、粒度は大きく保たれ、計算処理を全てのプロセッサが分担できることから台数効果を得やすい。実験では、細粒度並列処理でしか効果が上がらないと言われる微小ループでも、並列化により数倍程度の高速化が可能であることが確かめられた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we show a method of parallel execution of DOACROSS loops utilizing parallel execution techniques for linear recurrences. The method is able to make every processor in a system participate essential computation unlike such methods as normal DOACROSS execution and pipelining, which have critical paths in computation and cannot necessarily utilize all of the processors in a system. A drawback of the method shown in this paper is the increase of the amount of computation in order to cut serial chains of dependences. Experimental results show the method is feasible enough and efficient on both shared-memory systems and distributed-machine environments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2001, 号 22(2000-ARC-142), p. 133-138, 発行日 2001-03-08 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |