ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2024
  4. 2024-HPC-195

直接結合網におけるIn-Network AggregationによるAllreduceの高速化

https://ipsj.ixsq.nii.ac.jp/records/237592
https://ipsj.ixsq.nii.ac.jp/records/237592
0b5ef820-7f1e-46b0-95a7-7ec11661777e
名前 / ファイル ライセンス アクション
IPSJ-HPC24195031.pdf IPSJ-HPC24195031.pdf (1.5 MB)
 2026年8月1日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, HPC:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-08-01
タイトル
タイトル 直接結合網におけるIn-Network AggregationによるAllreduceの高速化
タイトル
言語 en
タイトル Accelerating Allreduce using In-Network Aggregation on Direct-connect Networks
言語
言語 jpn
キーワード
主題Scheme Other
主題 通信
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
NTT Software Innovation Center
著者所属
NTT Software Innovation Center
著者所属
NTT Software Innovation Center/現在, NTT Innovative Devices Corporation
著者所属
NTT Software Innovation Center
著者所属
NTT Software Innovation Center
著者所属(英)
en
NTT Software Innovation Center
著者所属(英)
en
NTT Software Innovation Center
著者所属(英)
en
NTT Software Innovation Center / NTT Innovative Devices Corporation
著者所属(英)
en
NTT Software Innovation Center
著者所属(英)
en
NTT Software Innovation Center
著者名 立岩, 斉明

× 立岩, 斉明

立岩, 斉明

Search repository
森田, 和孝

× 森田, 和孝

森田, 和孝

Search repository
石田, 渉

× 石田, 渉

石田, 渉

Search repository
村中, 勇介

× 村中, 勇介

村中, 勇介

Search repository
西潟, 愛美

× 西潟, 愛美

西潟, 愛美

Search repository
著者名(英) Nariaki, Tateiwa

× Nariaki, Tateiwa

en Nariaki, Tateiwa

Search repository
Kazutaka, Morita

× Kazutaka, Morita

en Kazutaka, Morita

Search repository
Wataru, Ishida

× Wataru, Ishida

en Wataru, Ishida

Search repository
Yusuke, Muranaka

× Yusuke, Muranaka

en Yusuke, Muranaka

Search repository
Manami, Nishikata

× Manami, Nishikata

en Manami, Nishikata

Search repository
論文抄録
内容記述タイプ Other
内容記述 Allreduce 集団通信は多くの分散アプリケーションの性能を決定づける重要な通信モデルであり,その高速化はアルゴリズムとインフラの両面から研究されてきた.In-Network Aggregation (INA) は演算機能を持つネットワークデバイス(集約デバイス)に集約計算をオフロードする技術であり,INA を用いた allreduce プロトコルは従来のプロトコルと比較してデータ転送時間を最大半減できる.しかし従来の INA 技術は間接結合網を前提としており,これをデータセンタや機械学習インフラで近年採用されている再構成可能な直接結合網に適用するには,場合によってはワーカー数の数倍にも及ぶ,非常に多くの集約デバイスが必要となる.このことは大規模な分散ジョブへの INA 適用を妨げる要因となる.本稿では再構成可能な直接結合網において使用可能な集約デバイス数が少ない状況であっても allreduce のデータ転送時間を削減するプロトコルの構築手法を提案する.我々の手法により,従来のプロトコルよりもより少ない集約デバイスでより小さい allreduce のデータ転送時間を持つプロトコルを構築できることを数値実験で示す.
論文抄録(英)
内容記述タイプ Other
内容記述 Allreduce collective communication is a crucial communication model that determines the performance of many distributed applications. Allreduce acceleration has been studied from both algorithmic and infrastructure perspectives. In-network aggregation (INA) is a technology that offloads aggregation to network devices (aggregation devices). The allreduce protocol using INA can reduce data transfer time by up to half compared to conventional protocols. Most current INA techniques use an aggregation tree approach in the premise of indirect-connect networks. To apply INA to the reconfigurable direct-connect networks adopted in data centers and machine learning infrastructure in recent years, many aggregation devices, sometimes several times the number of workers, are required. This prevents the application of INA to large-scale distributed jobs. In this paper, we propose a method for constructing a protocol that reduces the data transfer time of allreduce even in situations where we have few available aggregation devices. Our evaluation has found that it is possible to construct a protocol with a smaller allreduce data transfer time using fewer aggregation devices than with conventional protocols.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2024-HPC-195, 号 31, p. 1-12, 発行日 2024-08-01
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8841
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 08:49:57.412669
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3