Item type |
SIG Technical Reports(1) |
公開日 |
2024-01-18 |
タイトル |
|
|
タイトル |
多種類の畳み込みモジュールを組み合わせたYOLOv7-tinyによる物体検出モデルの軽量化の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Investigation of lightweight methods for object recognition models of YOLOv7-tiny using a combination of various kinds of convolution modules |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
中央大学理工学研究科 |
著者所属 |
|
|
|
中央大学理工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Chuo University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Chuo University |
著者名 |
李, 越東
久保田, 彰
|
著者名(英) |
Yuedong, Li
Akira, Kubota
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
深層学習に基づく画像上の物体検出技術は盛んに研究が行われている.近年ではモバイル端末などの小型デバイスに向けた軽量で高速なエッジ AI も注目されている.代表的な手法である YOLO シリーズは高検出速度で従来手法を上回る精度を記録したが,計算コストは高く,高性能な GPU を必要とする.これに対してより軽量なモデルである YOLO-tiny などは,GPU を用いずともリアルタイムな検出を可能とするが,一般的な深層学習モデルと比較して精度は劣るという課題がある.本研究では新たな目標検出手法として,YOLOv7-tiny の精度を維持したまま高速に検出を行う YOLOv7-tiny-light を提案する.本手法は,YOLOv7-tiny ネットワークを軽量化した畳み込みモジュール Ghost 畳み込み,Partial 畳み込み,Depthwise 畳み込みモジュールを用いることで計算量を大幅に削減する.また,精度を維持するために,Attention 機構を追加し,従来の活性化関数を FReLU に変更する.実験では,Pascal VOC データセットを用いて検出精度,パラメータ量,重みファイルの大きさなどの側面から評価を行い,従来手法に対して優位性を示した.また,検出結果の可視化によって検出精度の向上を視覚的に確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Deep learning-based object detection techniques on images have been actively studied. Recently, lightweight and fast-edge AI for small devices such as mobile terminals has also attracted attention. The YOLO series has achieved faster detection speed and higher accuracy than conventional methods, but they are computationally expensive and require a high-performance GPU. In contrast, lighter models such as YOLO-tiny enable real-time detection without a GPU but are less accurate than general deep learning models. In this study, we propose a new target detection method, YOLOv7-tiny-light, which improves detection speed while maintaining accuracy in YOLOv7-tiny. Our proposed model significantly reduces computational complexity by modifying the convolution modules of YOLOv7-tiny to lightweight Ghost convolution, Partial convolution, and Depthwise convolution modules. In addition, the Attention mechanism was added to maintain accuracy, and the conventional activation function was changed to FReLU. In experiments, we evaluated the detection accuracy, the number of parameters, and the size of the weight file using the Pascal VOC dataset and showed its superiority over the conventional method. In addition, visualization of the detection results visually confirmed the improvement in detection accuracy. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2024-CVIM-236,
号 28,
p. 1-6,
発行日 2024-01-18
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |