WEKO3
アイテム
Neural Architecture SearchによるSplit Inferenceの効率化
https://ipsj.ixsq.nii.ac.jp/records/222126
https://ipsj.ixsq.nii.ac.jp/records/22212662453d19-8380-4653-ac44-81ea181fab21
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-11-04 | |||||||||
| タイトル | ||||||||||
| タイトル | Neural Architecture SearchによるSplit Inferenceの効率化 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
| 資源タイプ | technical report | |||||||||
| 著者所属 | ||||||||||
| 東京工業大学 | ||||||||||
| 著者所属 | ||||||||||
| 東京工業大学 | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Tokyo Institute of Technology | ||||||||||
| 著者所属(英) | ||||||||||
| en | ||||||||||
| Tokyo Institute of Technology | ||||||||||
| 著者名 |
永松, 直樹
× 永松, 直樹
× 原, 祐子
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 本研究では,機械学習モデルの設計を自動化する Neural Architecture Search(NAS)を用いて Split Inference を最適化する手法を提案する.Split Inference とは,一つの機械学習モデルを組込み機器上で処理する Head モデルとエッジサーバ上で処理する Tail モデルに分割して協調的に推論を行う技術である.NAS のモデル探索では報酬関数に基づいて複数のモデルを比較し,報酬スコアが最も高い機械学習モデルを出力する.この報酬関数でサイクル精度の遅延時間,および,組込み機器とエッジサーバ間の通信時間を考慮することで,機械学習の推論時間と精度のトレードオフの探索を可能にする. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AA11451459 | |||||||||
| 書誌情報 |
研究報告システムとLSIの設計技術(SLDM) 巻 2022-SLDM-199, 号 2, p. 1-4, 発行日 2022-11-04 |
|||||||||
| ISSN | ||||||||||
| 収録物識別子タイプ | ISSN | |||||||||
| 収録物識別子 | 2188-8639 | |||||||||
| Notice | ||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||