WEKO3
アイテム
口唇動作と音声の共起に着目した被写体と話者の不一致検出~ニュース映像への適用と評価~
https://ipsj.ixsq.nii.ac.jp/records/74085
https://ipsj.ixsq.nii.ac.jp/records/740854e5c65c3-a4f8-464c-9ebc-8960952866b6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2011 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
EC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-05-06 | |||||||
タイトル | ||||||||
タイトル | 口唇動作と音声の共起に着目した被写体と話者の不一致検出~ニュース映像への適用と評価~ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio - An Application to News Video and its Evaluation - | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 萌芽セッション(MVE) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
岐阜聖徳学園大学経済情報学部 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Economics and Information, Gifu Shotoku Gakuen University, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University, Japan | ||||||||
著者名 |
熊谷, 章吾
道満, 恵介
高橋, 友和
出口, 大輔
井手, 一郎
村瀬, 洋
× 熊谷, 章吾 道満, 恵介 高橋, 友和 出口, 大輔 井手, 一郎 村瀬, 洋
|
|||||||
著者名(英) |
Shogo, Kumagai
Keisuke, Doman
Tomokazu, Takahashi
Daisuke, Deguchi
Ichiro, Ide
Hiroshi, Murase
× Shogo, Kumagai Keisuke, Doman Tomokazu, Takahashi Daisuke, Deguchi Ichiro, Ide Hiroshi, Murase
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら 2 つの実験から,提案手法の有効性および有用性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Speech scenes in news videos contain a wealth of multimedia information, and are valuable as archived material. In order to extract speech scenes from news videos, there is an approach that uses the position and size of a face region. However, it is difficult to extract them with only the approach, since news videos contain scenes where the speakers are not the subjects such as in narration scenes. To solve this problem, we have been proposing a method to detect the inconsistency between face and speaker focusing on the co-occurrence of the lip motion and the speech. However, the evaluations for the proposed method were performed in an ideal condition without much noise. In this paper, we report the investigation on the performance of the proposed method not only with videos captured in ideal conditions but also with actual broadcasted news videos. Their results showed the effectiveness and the usefulness of our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA12049625 | |||||||
書誌情報 |
研究報告エンタテインメントコンピューティング(EC) 巻 2011-EC-20, 号 18, p. 1-6, 発行日 2011-05-06 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |