@techreport{oai:ipsj.ixsq.nii.ac.jp:00241706, author = {福岡, 伶音 and 宮島, 敬明}, issue = {13}, month = {Dec}, note = {Cerebras CS-2 は,300mm ウェハを 1 つのチップとして利用した Wafer Scale Engine-2 (WSE-2) を搭載した大規模深層学習向けアクセラレータである.WSE-2 には約 85 万個のプロセッシングエレメント(PE)が搭載され,それぞれは 2 次元メッシュで接続されている.PE 間のメモリの一貫性は保証されないため,CS-2 を科学技術計算に利用する際は 1 つの分散並列システムとして扱うことになる.科学技術計算に頻出する集団通信などの通信パターンは CS-2 でも実行可能だが,その特性理解は進んでおらず,基礎的な性能評価が必要である.本稿では,WSE-2 における各種 1 次元通信パターン (2PE 間通信レイテンシ,バイセクションバンド幅,Broadcast,Gather,Scatter,Reduce,AllReduce,AllReduce,Alltoall 通信) の所要時間の測定とモデル化を行った.}, title = {Cerebras CS-2におけるプロセッシングエレメント間の通信性能評価}, year = {2024} }