@techreport{oai:ipsj.ixsq.nii.ac.jp:00231949, author = {里, 雄二 and 嘉本, 海大 and 植田, 剛央 and 石井, 育規 and 山下, 隆義}, issue = {27}, month = {Jan}, note = {近年,行動認識タスクにおいて動画像に対応したトランスフォーマーが提案され,高い性能を達成している.既存の動画像対応のトランスフォーマーの多くは,事前設計された固定位置のパッチでアテンションを算出している.そのため,フレーム内とフレーム間の特定の位置同士でパッチを比較することになり,動画内の人物の動きが考慮されない.また,動画フレーム間の動きから,クエリパッチが注意を向けるべき領域を予測する動的なアテンションに基づく手法も提案されているが,動画全体の動きであり,行動クラスに関連する人物の動きが考慮されていない.これらの課題に対し,我々は人の行動認識に寄与する人体部位の動きに基づいた動的なアテンション機構を持つトランスフォーマーを提案する.}, title = {行動認識のための人体部位の動きに基づくDeformable Attention}, year = {2024} }