WEKO3
アイテム
超並列計算機CP - PACSによるニューラルネットワーク計算の高速化
https://ipsj.ixsq.nii.ac.jp/records/29713
https://ipsj.ixsq.nii.ac.jp/records/2971360413b65-b22a-429b-ade5-c55a675a4f32
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-08-19 | |||||||
タイトル | ||||||||
タイトル | 超並列計算機CP - PACSによるニューラルネットワーク計算の高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Neural network computation on a massively parallel computer : CP - PACS | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属 | ||||||||
筑波大学電子・情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Sciences and Electronics, University of Tsukuba | ||||||||
著者名 |
吉田, 英嗣
× 吉田, 英嗣
|
|||||||
著者名(英) |
Eiji, Yoshida
× Eiji, Yoshida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ニューラルネットワーク学習の1つであるBack?propagation()学習法は,様々な分野で有力である半面,その学習計算には膨大な時間が必要である.本研究では,3次元HXBを持つ超並列計算機CP?PACSによるBP学習の高速化を図る.実装には,パターンデータパラレルとニューロンパラレル,更にそれらを組み合わせた並列化方法を用いた.評価には,BPのべンチマークとして広く利用されているNETtalk(英単語を発音記号に変換するBPアプリケーション)を用いた.評価の結果,2つの並列化を組み合わせた方法では,256プロセッサで毎秒約10億回の結合重み更新が可能であることが分かった.更に,パターンデータパラレルとニューロンパラレルそれぞれの結果から,それら2つの最適な組み合わせを見つけるための方法を提案し,実験によりその有効性を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Back-propagation(BP), which is one of artificial neural network algorithms, requires very long training time, though it has high performance for various applications. In this research, to overcome this difficulty, we implemented the BP algorithm on a massively parallel computer "CP-PACS" using pattern-data-parallelism, neuron-parallelism, and their combination. To evaluate this peformance, we used NETtalk, which is one of BP applications, as a BP benchmark. We obtained high performance with the combination of the above two parallelisms, and achieved 10 billion weight-updates per second using 256 processors. We proposed a method to find the optimal combination of two parallelisms, and showed its efficiency experimentally. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 1997, 号 75(1997-HPC-067), p. 25-30, 発行日 1997-08-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |