WEKO3
アイテム
畳み込みニューラルネットワークの行列計算におけるTensorコアを用いた並列処理
https://ipsj.ixsq.nii.ac.jp/records/214626
https://ipsj.ixsq.nii.ac.jp/records/21462626cce707-da17-4502-a0f0-84b3070ab0fd
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-03-04 | |||||||||
| タイトル | ||||||||||
| タイトル | 畳み込みニューラルネットワークの行列計算におけるTensorコアを用いた並列処理 | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | コンピュータシステム | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
| 資源タイプ | conference paper | |||||||||
| 著者所属 | ||||||||||
| 明大 | ||||||||||
| 著者所属 | ||||||||||
| 明大 | ||||||||||
| 著者名 |
大内, 佑一朗
× 大内, 佑一朗
× 吉田, 明正
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 物体検出のディープラーニングに用いられる畳み込みニューラルネットワーク(CNN)では多くの行列計算が行われており,学習時間を短縮するためには行列計算の高速化が不可欠である.行列計算の高速化には,GPUの活用が広く行われているが,さらなる速度向上を実現するためには,単精度浮動小数点数FP32の代わりに,半精度浮動小数点数FP16を利用して,GPUの演算性能を高めることが挙げられる.加えて,Tensorコアを活用することにより,行列計算の高速化が可能になる.そこで本手法では,FP16およびTensorコアを利用するCUDAプログラムを開発しており,CNNの行列計算部分に適用した. NVIDIA Quadro RTX 6000上で行った性能評価の結果,提案手法の有効性が確認された. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN00349328 | |||||||||
| 書誌情報 |
第83回全国大会講演論文集 巻 2021, 号 1, p. 25-26, 発行日 2021-03-04 |
|||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||