WEKO3
アイテム
多人数会話における視線情報を用いた話者区間検出
https://ipsj.ixsq.nii.ac.jp/records/102192
https://ipsj.ixsq.nii.ac.jp/records/10219233f17a09-71e8-4cc3-b6f5-e4c440907606
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2014-07-17 | |||||||
| タイトル | ||||||||
| タイトル | 多人数会話における視線情報を用いた話者区間検出 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | マルチモーダル | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科 | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科/京都大学学術情報メディアセンター | ||||||||
| 著者名 |
井上昂治
若林佑幸
吉本廣雅
河原達也
× 井上昂治 若林佑幸 吉本廣雅 河原達也
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 多人数会話において視線情報を用いた話者区間検出手法を提案する.実世界の多人数会話では,マイクから離れた位置での発話や周囲の騒音などにより,話者区間検出精度が低下する.一方,会話参与者の視線情報は,これらの音響的影響を受けない.また,視線配布は会話の発話権取得に重要な役割を担っているため,発話の予測にも有用であると考えられる.提案手法は,音響と視線の情報を確率的に統合するもので,3 種類のモデル化を行う.実際に収録したポスター会話を用いた評価実験において,提案手法により,音響情報のみを用いたモデルに比べて,話者区間検出精度が向上した. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2014-SLP-102, 号 1, p. 1-6, 発行日 2014-07-17 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||