Item type |
Symposium(1) |
公開日 |
2024-06-19 |
タイトル |
|
|
タイトル |
文脈に基づくネットワークカメラ映像の変化点抽出および説明手法の提案 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Change Point Extraction and Explanation Method for Network Camera Footage Based on Context |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
株式会社NTTドコモ/慶應義塾大学 |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
株式会社NTTドコモ |
著者所属 |
|
|
|
慶應義塾大学 |
著者名 |
北出, 卓也
山谷, 佳祐
春山, 知生
中村, 匠
安川, 真平
今井, 倫太
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ネットワークカメラの普及により,遠隔地の映像をリアルタイムに確認可能となっている.特に自動運転車両における遠隔監視は一人のオペレータが複数映像を監視することで省人化が可能となるため,映像監視自動化システムの重要性が増しており,システムとしてはオペレータが特に確認すべきシーンを抽出し,オペレータが短時間に理解可能な情報として提示できることが求められている.これまでもネットワークカメラ映像に映る人物の行動を分析する手法が研究されてきたが,それぞれの行動に対して認識モデルの開発が必要であった.そこで本研究では「人の動きがある」シーンのみを抽出しVLMで汎用的に分析し,その結果を使用してシーンを短文で説明する手法を提案する.VLMを説明した文章の文脈変化が大きな部位がシーンの大きな変化となり得るという考え方で,オペレータが確認すべきシーンを絞り込む.この手法により,自動運転バスを想定した映像から重要なシーンを抽出し,文章での説明ができること,そして実用上の課題を確認した. |
書誌情報 |
マルチメディア,分散,協調とモバイルシンポジウム2024論文集
巻 2024,
p. 1304-1310,
発行日 2024-06-19
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |