{"created":"2025-01-19T01:39:52.619692+00:00","updated":"2025-01-19T08:55:33.439171+00:00","metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00237314","sets":["1164:2836:11471:11658"]},"path":["11658"],"owner":"44499","recid":"237314","title":["拡張性の高いマイクロ行動認識を実現するクラス表現のための言語-行動エンコーダの提案と評価"],"pubdate":{"attribute_name":"公開日","attribute_value":"2024-07-11"},"_buckets":{"deposit":"02dfa6f7-e8f1-4346-88e6-36bdecd63241"},"_deposit":{"id":"237314","pid":{"type":"depid","value":"237314","revision_id":0},"owners":[44499],"status":"published","created_by":44499},"item_title":"拡張性の高いマイクロ行動認識を実現するクラス表現のための言語-行動エンコーダの提案と評価","author_link":["649590","649587","649588","649589"],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"拡張性の高いマイクロ行動認識を実現するクラス表現のための言語-行動エンコーダの提案と評価"}]},"item_keyword":{"attribute_name":"キーワード","attribute_value_mlt":[{"subitem_subject":"情報システム・行動解析","subitem_subject_scheme":"Other"}]},"item_type_id":"4","publish_date":"2024-07-11","item_4_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"奈良先端科学技術大学院大学"},{"subitem_text_value":"奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター"},{"subitem_text_value":"奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター"},{"subitem_text_value":"奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター"}]},"item_4_text_4":{"attribute_name":"著者所属(英)","attribute_value_mlt":[{"subitem_text_value":"Nara Institute of Science and Technology","subitem_text_language":"en"},{"subitem_text_value":"Nara Institute of Science and Technology / RIKEN, Center for Advanced Intelligence Project","subitem_text_language":"en"},{"subitem_text_value":"Nara Institute of Science and Technology / RIKEN, Center for Advanced Intelligence Project","subitem_text_language":"en"},{"subitem_text_value":"Nara Institute of Science and Technology / RIKEN, Center for Advanced Intelligence Project","subitem_text_language":"en"}]},"item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/237314/files/IPSJ-DPS24200007.pdf","label":"IPSJ-DPS24200007.pdf"},"date":[{"dateType":"Available","dateValue":"2026-07-11"}],"format":"application/pdf","billing":["billing_file"],"filename":"IPSJ-DPS24200007.pdf","filesize":[{"value":"1.6 MB"}],"mimetype":"application/pdf","priceinfo":[{"tax":["include_tax"],"price":"660","billingrole":"5"},{"tax":["include_tax"],"price":"330","billingrole":"6"},{"tax":["include_tax"],"price":"0","billingrole":"34"},{"tax":["include_tax"],"price":"0","billingrole":"44"}],"accessrole":"open_date","version_id":"8151b775-6925-4c6a-90df-ef236dd51712","displaytype":"detail","licensetype":"license_note","license_note":"Copyright (c) 2024 by the Information Processing Society of Japan"}]},"item_4_creator_5":{"attribute_name":"著者名","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"笹崎, 海利"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"松井, 智一"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"諏訪, 博彦"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"安本, 慶一"}],"nameIdentifiers":[{}]}]},"item_4_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN10116224","subitem_source_identifier_type":"NCID"}]},"item_4_textarea_12":{"attribute_name":"Notice","attribute_value_mlt":[{"subitem_textarea_value":"SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc."}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_18gh","resourcetype":"technical report"}]},"item_4_source_id_11":{"attribute_name":"ISSN","attribute_value_mlt":[{"subitem_source_identifier":"2188-8906","subitem_source_identifier_type":"ISSN"}]},"item_4_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"センサや機械学習技術の発展により行動認識の精度が高まりつつあるが,多くの研究は「粗い」粒度のマクロ行動認識に留まっており,例えば料理行動支援サービスのようなコンテキストアウェアな利便性の高い宅内サービスの提供には,居住者の現在の行動を細分化したマイクロ行動の認識が必要になる.しかし,従来のマイクロ行動認識では行動クラスをあらかじめ決めておく必要があり,拡張性において課題がある.本研究は行動認識結果の実利用を念頭に置いた,拡張性の高いマイクロ行動表現手法の開発およびその表現を用いた行動認識手法の開発を目的とする.分散表現を用いることで近傍のデータとの類似度を計算によるマイクロ行動の推定などが可能になる.具体的には,有限次元のベクトルで網羅的に行動を定義できる分散表現を用いた行動認識手法を提案する.自然言語による表現力を利用するため,自然言語から行動の分散表現を生成する言語-行動エンコーダを構築した.これにより,ビデオデータと分散表現をペアとしたデータセットを作成する.最終的に事前学習済みモデルの X3D(Expanding Architectures for Efficient Video Recognition)を特徴抽出器としたモデルを用いてビデオデータから行動の分散表現を推論し,その結果を用いて行動認識を行う.本稿では,行動についての描写的な説明文から行動の分散表現を獲得する言語-行動エンコーダを作成し,公開データセットの STAIR Actions を利用して言語-行動エンコーダの精度を評価した結果と,ビデオデータから行動の分散表現を推論する行動認識モデルの初期実験結果について報告する.","subitem_description_type":"Other"}]},"item_4_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"7","bibliographic_titles":[{"bibliographic_title":"研究報告マルチメディア通信と分散処理(DPS)"}],"bibliographicPageStart":"1","bibliographicIssueDates":{"bibliographicIssueDate":"2024-07-11","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"7","bibliographicVolumeNumber":"2024-DPS-200"}]},"relation_version_is_last":true,"weko_creator_id":"44499"},"id":237314,"links":{}}