WEKO3
-
RootNode
アイテム
Transformer を用いた人物行動検出
https://ipsj.ixsq.nii.ac.jp/records/216974
https://ipsj.ixsq.nii.ac.jp/records/216974e3199f9a-cf3c-4d4c-9e1d-18f42939a112
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
CVIM:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-03-03 | |||||||||
タイトル | ||||||||||
タイトル | Transformer を用いた人物行動検出 | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | セッション6-A | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
電気通信大学大学院情報理工学研究科情報学専攻 | ||||||||||
著者所属 | ||||||||||
電気通信大学大学院情報理工学研究科情報学専攻 | ||||||||||
著者名 |
水野, 颯介
× 水野, 颯介
× 柳井, 啓司
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | ビデオ内の人間の行動を検出及び認識する行動検出のタスクにおいて,既存研究は CNN をベースにした手法が主流である.近年,自然言語処理で使用される Transformer をコンピュータビジョンに活用したモデルが行動認識タスクにおいて CNN を用いた手法を上回っている.また,CNN と Self-Attention を組み合わせたモデルである CoAtNet が画像認識タスクにおいて高い精度を達成した.しかし,Transformer をベースにした行動検出手法は少なく,CoAtNet をベースにした動画認識手法は存在しない.本論文では,Transformer をベースにした行動検出手法及び,CoAtNet を行動認識に拡張した Video CoAtNet を提案する.実験の結果,Transformer ベースの提案手法は,CNN ベースの手法よりも高精度を達成し,あるクラスでは最大 39% の精度向上を達成することを示した. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11131797 | |||||||||
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2022-CVIM-229, 号 43, p. 1-6, 発行日 2022-03-03 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8701 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |