WEKO3
アイテム
大規模画像データセットを用いたマルチクラス物体検出器の同時学習 物体毎に特化した負例クラスの導入
https://ipsj.ixsq.nii.ac.jp/records/83583
https://ipsj.ixsq.nii.ac.jp/records/83583f0965bbd-bf0a-4a7b-8bfb-37892651ff52
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2012 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
CVIM:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-08-26 | |||||||
タイトル | ||||||||
タイトル | 大規模画像データセットを用いたマルチクラス物体検出器の同時学習 物体毎に特化した負例クラスの導入 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Simultaneous training of multi-class object detectors via large scale image dataset introduction of target specific negative classes | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科/JSTさきがけ | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo / JST PRESTO | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者名 |
金崎, 朝子
稲葉, 翔
牛久, 祥孝
山下, 裕也
村岡, 宏是
原田, 達也
國吉, 康夫
× 金崎, 朝子 稲葉, 翔 牛久, 祥孝 山下, 裕也 村岡, 宏是 原田, 達也 國吉, 康夫
|
|||||||
著者名(英) |
Asako, Kanezaki
Sho, Inaba
Yoshitaka, Ushiku
Yuya, Yamashita
Hiroshi, Muraoka
Tatsuya, Harada
Yasuo, Kuniyoshi
× Asako, Kanezaki Sho, Inaba Yoshitaka, Ushiku Yuya, Yamashita Hiroshi, Muraoka Tatsuya, Harada Yasuo, Kuniyoshi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 大規模データを用いて,マルチクラスの物体検出器を同時に最適化する効率的な手法を提案する.従来の物体検出器の学習は,各検出対象物体をpositiveサンプル,それ以外の物体をnegativeサンプルとして識別境界を決定する,”one-vs-aIl”のアプローチをとるものが主流であった.しかしながら,この方法では各クラスを独立に学習するため,異なるクラス間のスコアのバランスを調整できない.提案手法は,マルチクラスの識別手法を応用してマルチクラスの物体検出器を同時に学習することで,クラス間のバランスを最適化する.このとき,学習対象物体クラス間の差違だけでなく,その他の大量の背景画像と各クラスとの差違を考慮することで,未知物体の誤検出を抑える.実験では,大規模一般物体認識コンペテイションILSVRC2011で用いられた大量データセットのサブセットによる評価を行い,提案手法の有効性を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose an efficient method to train multiple object detectors simultaneously using a large-scale image dataset.The one-vs-all approach that optimizes the boundary between positive samples from a target class and negative samples from the others has been the most standard approach for object detection. However, because this approach trains each object detector independently, the likelihoods are not balanced between object classes. The proposed method combines ideas derived from both detection and classification in order to balance the scores across all object classes. We optimized the boundary between target classes and their hard-negative samples, just as in detection, while simultaneously balancing the detector likelihoods across object classes, as done in multi-class classification. We evaluated the performances on multi-class object detection using a subset of the ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2011 dataset and showed our method outperformed a de facto standard method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11131797 | |||||||
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2012-CVIM-183, 号 17, p. 1-8, 発行日 2012-08-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |