2024-03-29T06:10:54Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000136402022-10-21T05:24:51Z00581:00742:00749
マルチモーダル対話データベースに基づく音声と身振りの認識系統合モデルIntegrated Recognition Models of Keywords in Speech and Head Movements Using a Multimodal Interaction Databasejpn論文http://id.nii.ac.jp/1001/00013640/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=13640&item_no=1&attribute_id=1&file_no=1Copyright (c) 1996 by the Information Processing Society of Japanパターン認識シャープ株式会社映像メディア研究所内RWCP新機能シャープ研究室シャープ株式会社映像メディア研究所内RWCP新機能シャープ研究室シャープ株式会社映像メディア研究所内RWCP新機能シャープ研究室湯浅, 夏樹三谷, 純司外川, 文雄本稿では 音声と頭の動きを統合して扱い ユーザの意図(肯定/否定)の識別をマルチモーダル対話データベース中のデータに基づいて行う「認識系統合モデル」を提案する.そしてこのモデルの意図識別率とマルチモーダルインタフェースの快適度の2点について評価した結果について述べる.その結果 実際の対話システムを開発して評価したときの識別率は 音声だけを用いた場合が86.3% 頭の動きだけを用いた場合が55.6%なのに対し 音声と頭の動きを両方とも用いた場合が91.9%となり 本認識系統合モデルが有効に機能することを確認できた. また 今回試作したマルチモーダルインタフェースを快適に感じるかどうかには個人差があることが分かった.This paper describes an integrated recognition model of keywords in speech and head movements using a multimodal interaction database, and describes this system's accuracy and comfortable degree. In the results, in use of speech recognition only, a success rate of 86.3% was achieved, and in use of head movements recognition only, a success rate of 55.6% was achieved, but in use of both recognition, a success rate of 91.9% was achieved. And we confirmed that there are differences among individuals of feeling the system's comfortable degree.AN00116647情報処理学会論文誌376104910601996-06-151882-77642009-06-29