Item type |
SIG Technical Reports(1) |
公開日 |
2021-02-25 |
タイトル |
|
|
タイトル |
Shifting-subclipとHard Positive Miningを適用した人物照合のためのTwo-stream Feature-fusionアーキテクチャの評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluations on Two-stream Feature-fusion Architecture with Shifting-subclip and Hard Positive Mining for Person Re-identification |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
セッション2-2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学大学院 基幹理工学研究科情報理工・情報通信専攻 |
著者所属 |
|
|
|
早稲田大学理工学術院 |
著者所属(英) |
|
|
|
en |
|
|
Dept. of Computer Sc. and Communications Eng., Waseda Univ. |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Sc. and Eng., Waseda Univ. |
著者名 |
廣井, 優姫
亀山, 渉
|
著者名(英) |
Yuki, Hiroi
Wataru, Kameyama
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
時空間特徴量を用いた人物照合技術(Video-based Re-ID)として,筆者らは,人物の全身と部分特徴量を並列的に抽出する Two-stream Feature-fusion アーキテクチャと,ビデオクリップを隣接フレーム毎にシフトさせながら CNN を適用する Shifting-subclip を提案している.また,識別が困難な人物の識別精度を上げるために,Re-ID に適した Hard Positive Mining を提案している.しかし,これらの提案手法は,それぞれ個別に,MARS データセットでのみ評価していた.そこで,本稿では,全ての手法を組み合わせ,複数のデータセットにおいて従来手法と比較した結果を報告する.実験の結果,ILIDS-VID,PRID 及び MARS データセットにおいて,有効な部分特徴量は人物の写り方に影響するものの,提案する Two-stream Feature-fusion アーキテクチャは有効であること,また,Shifting-subclip はフレーム数の少ないデータセットにのみ有効であることが分かった.データセットの性質上,Hard Positive Mining に関しては MARS データセットのみで評価を行ったが,Two-stream Feature-fusion アーキテクチャ及び Shifting-subclip と組み合わせることで更に精度が向上した.以上から,提案手法がある程度汎用的に様々なデータセットに対して有効であることが示唆された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
As a person re-identification technology using spatial-temporal features (video-based Re-ID), we have proposed two-stream feature-fusion architecture which parallelly extracts entire body-image features and partial body-image features, and shifting-subclip which is to apply CNN several times to the neighboring frames by shifting frames. We have also proposed hard positive mining for Re-ID to improve the identification accuracy of persons who are difficult to identify. However, these proposed methods are individually evaluated only using MARS dataset. Therefore, in this paper, we report the results of all combined methods compared with the conventional method in multiple datasets. As the result of the experiment in ILIDS-VID, PRID and MARS datasets, although the effectiveness of partial body-image features are different depending on the appearance of persons in each dataset, we confirm that the proposed two-stream feature-fusion architecture is effective in these three datasets. We also confirm that the proposed shifting-subclip is effective only for datasets with a small number of frames. Due to the nature of the datasets, the proposed hard positive mining is evaluated only using MARS dataset, however, the accuracy is further improved by combining it with the two-stream feature-fusion architecture and the shifting-subclip. Therefore, it is suggested that the proposed three methods are effective for various datasets in general. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2021-CVIM-225,
号 17,
p. 1-6,
発行日 2021-02-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |