@techreport{oai:ipsj.ixsq.nii.ac.jp:00240578, author = {平岡, 滉司 and 中村, 優吾 and 荒川, 豊}, issue = {3}, month = {Nov}, note = {ウェアラブルカメラによる行動認識は,1 人称視点映像の大規模なデータセットの提供やコンピュータビジョンの技術の発展とともに進歩してきた.カメラによる視覚情報の活用は,行動認識に有用である反面,顔や個人を識別できる情報も収集されるため,ぼかし処理やマスキング処理によって画像からプライバシ情報を除去する手法が検討されてきた.しかし,プライバシ処理が施されていたとしても,ユーザーは画像が利用されること自体に不快感を示したり,プライバシ処理済み画像を保存しても再利用性に欠けるといった問題点がある.そこで,新たなプライバシ保護手法として,エッジ VLM で生成した画像キャプションデータの利用を提案する.エッジ VLM とは,エッジデバイス内で処理できる軽量な VLM(Vision and Language Model)を指し,画像内の状況を説明するようなテキストデータを生成させ,センサデータと組み合わせることで,画像データを利用することなく,視覚情報を付与することが可能となる.認識タスクの一例として,デスクワーク 6 種 (タイピング,マウス操作,スマートフォン操作,飲む,書く,その他) を採用し,加速度データと画像キャプションデータによるマルチモーダルモデルの行動認識への適応可能性について調査した.また,これまでのプライバシ処理手法と比較し,提案システムの有効性を評価した.}, title = {ウェアラブルカメラを用いたプライバシアウェアな行動認識のためのエッジVLMの適用可能性の検討}, year = {2024} }