WEKO3
アイテム
Cerebras CS-2を用いたリダクション処理の実装と性能評価
https://ipsj.ixsq.nii.ac.jp/records/225154
https://ipsj.ixsq.nii.ac.jp/records/225154b3f179ca-b7f8-4a7d-b8a7-120064e12c3d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-03-09 | |||||||||
| タイトル | ||||||||||
| タイトル | Cerebras CS-2を用いたリダクション処理の実装と性能評価 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 機械学習 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 明治大学理工学部情報科学科 | ||||||||||
| 著者所属 | ||||||||||
| 明治大学理工学部情報科学科 | ||||||||||
| 著者名 |
福岡, 伶音
× 福岡, 伶音
× 宮島, 敬明
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 近年の計算機は演算性能が向上しているが,Byte/Flops 値で表されるメモリ帯域と演算性能の比率は悪化し続けており,増大する消費電力も性能向上の阻害要因となっている.また,マルチノード環境では演算に比べて非常に長いノード間通信がボトルネックになり,スケーリングが問題となっている.この様な計算機システムで高い性能を達成するには,アプリケーションとシステムへの深い知識と高いプログラミング能力が求められる.これらの問題を解決すべく開発された Cerebras CS-2 システムは,749,715 個のプロセッシング・エレメントを持つ世界最大のチップ Wafer Scale Engine-2 を搭載する高性能計算および深層学習向けのアクセラレータである.本研究の最終目的は,大規模な科学技術計算への CS-2 の適用可能性を理解することである.本稿では,STREAM ベンチマークを模した指標を用いて CS-2 実機の演算性能とメモリバンド幅の測定ならびに消費電力の評価と,リダクションの性能モデル作成と全系での性能評価について述べる.全系の実効演算性能は半精度/単精度浮動小数演算で最大 2.98/1.02 PFlops を,メモリバンド幅はそれぞれ最大 8.94/8.93 PB/s を達成し,その際の消費電力は 16.40kW であった. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN10463942 | |||||||||
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2023-HPC-188, 号 10, p. 1-8, 発行日 2023-03-09 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8841 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||