WEKO3
アイテム
Intel HD GraphicsにおけるResnet50の高速化
https://ipsj.ixsq.nii.ac.jp/records/208866
https://ipsj.ixsq.nii.ac.jp/records/208866983b87b6-d79c-40e3-ab04-d1c5e09cdeb6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2020 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2020-12-14 | |||||||||||
タイトル | ||||||||||||
タイトル | Intel HD GraphicsにおけるResnet50の高速化 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 深層学習 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
岩手県立大学大学院ソフトウェア情報学研究科 | ||||||||||||
著者所属 | ||||||||||||
岩手県立大学大学院ソフトウェア情報学研究科 | ||||||||||||
著者所属 | ||||||||||||
岩手県立大学大学院ソフトウェア情報学研究科 | ||||||||||||
著者名 |
近藤, 鯛貴
× 近藤, 鯛貴
× 竹田, 大将
× 佐藤, 裕幸
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年 AI ブームに伴い,小型ボード上で Deep Neural Network (DNN) の推論処理をリアルタイムで行うことの需要が高い.Intel HD Graphics は Intel 社 SoC に搭載された統合 GPU であり,同社の OpenVINO ツールキットを用いることで GPGPU による DNN 推論が可能である.しかし,GPGPU 実装は性能を最大に引き出すことが難しい OpenCL を用いており,また実装アルゴリズムも最適であると言い難い.本研究ではアセンブリ並みのパフォーマンスを引き出すことのできる C for Metal 言語を用いて Resnet50 を実装,さらに行列積の最適化や Winograd 実装を行った.結果として OpenVINO と比較し,畳み込み層のカーネル 3x3 は Winograd 実装により最大 37.28%,1x1 は行列積実装および最適化により最大 23.95% の高速化となり,推論時間は最大 23.53% の高速化に成功した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10463942 | |||||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2020-HPC-177, 号 2, p. 1-6, 発行日 2020-12-14 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8841 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |