ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2017
  4. 2017-HPC-160

動的なプロセス数操作による分散深層学習の耐故障性と性能評価

https://ipsj.ixsq.nii.ac.jp/records/182770
https://ipsj.ixsq.nii.ac.jp/records/182770
f6daa329-17e3-4125-b74c-e81ec8d633c5
名前 / ファイル ライセンス アクション
IPSJ-HPC17160009.pdf IPSJ-HPC17160009.pdf (968.0 kB)
Copyright (c) 2017 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2017-07-19
タイトル
タイトル 動的なプロセス数操作による分散深層学習の耐故障性と性能評価
言語
言語 jpn
キーワード
主題Scheme Other
主題 耐故障性
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京工業大学
著者所属
東京工業大学
著者所属
東京工業大学
著者所属
デンソーアイティーラボラトリ
著者所属
東京工業大学
著者名 辻, 陽平

× 辻, 陽平

辻, 陽平

Search repository
野村, 哲弘

× 野村, 哲弘

野村, 哲弘

Search repository
實本, 英之

× 實本, 英之

實本, 英之

Search repository
佐藤, 育郎

× 佐藤, 育郎

佐藤, 育郎

Search repository
松岡, 聡

× 松岡, 聡

松岡, 聡

Search repository
論文抄録
内容記述タイプ Other
内容記述 深層学習はその認識精度の高さから研究開発が盛んに行われており,実社会においても深層学習を取り入れた応用技術を目にすることができる.深層学習では十分な認識精度を得るまでに,大量のデータと GPU などを用いた長時間の計算が必要となる.そのため HPC クラスタなどの高性能計算機での分散処理が利用される.分散システムでは故障発生間隔が短くなる傾向があり,アプリケーションの計算を正しく継続させるために耐故障性の手法が必要になる.本研究では大規模システム上の深層学習において重要になる耐故障性に対して,既存の checkpoint / restart でない新たな手法 detect / respawn を提案し,これを ULFM-MPI によって実装した.SPRINT と呼ばれる分散深層学習アプリケーションを用いて TSUBAME-KFC の 16 ノード (128 GPU) 上で提案手法と既存手法を比較したところ,10 時間の学習において提案手法が 2.5% 低いエラー率となり,より高い認識精度を達成することができた.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2017-HPC-160, 号 9, p. 1-7, 発行日 2017-07-19
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8841
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 03:56:29.643590
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3