ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出

井上, 昂治; 若林, 佑幸; 吉本, 廣雅; 高梨, 克也; 河原, 達也

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出

https://ipsj.ixsq.nii.ac.jp/records/113132

名前 / ファイル	ライセンス	アクション
IPSJ-SLP15105009.pdf (794.3 kB)	Copyright (c) 2015 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2015-02-20

タイトル

ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出

言語

jpn

キーワード

主題Scheme

Other

主題

翻訳・マルチモーダル

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

京都大学大学院情報学研究科

著者所属

立命館大学大学院情報理工学研究科

著者所属

京都大学学術情報メディアセンター

著者所属

京都大学学術情報メディアセンター

著者所属

京都大学大学院情報学研究科／京都大学学術情報メディアセンター

著者名

井上, 昂治
若林, 佑幸
吉本, 廣雅
高梨, 克也
河原, 達也

論文抄録

内容記述タイプ

Other

内容記述

学会やオープンラボなどでなされるポスターセッションにおける会話を対象として，各会話参与者がいつ発話したかという情報（話者区間）とそのうちの相槌を検出する手法を述べる．実際のポスター会話では，自然な話し言葉や周囲の騒音などにより検出精度が低下する．著者らは話者区間検出において，従来法で用いられてきた音響情報に対して，会話における発話権取得で重要な役割を担う視線情報を統合するマルチモーダルな手法を提案している．本稿では，視線特徴量と確率的統合モデルについて検討・改善を行った．また，検出した聴衆の発話区間が相槌であるかを，話者区間検出と同様のマルチモーダルな手法で判定し，相槌を発話区間から除去することで質問やコメントなどの発話のみを抽出する．実験結果から，音響情報と視線情報を統合することで雑音環境下での検出精度の向上が確認された．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2015-SLP-105, 号 9, p. 1-6, 発行日 2015-02-20

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-20 19:46:50.395256

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出

× 井上, 昂治

× 若林, 佑幸

× 吉本, 廣雅

× 高梨, 克也

× 河原, 達也

Versions

Share

Cite as

エクスポート