| Item type |
SIG Technical Reports(1) |
| 公開日 |
2015-02-20 |
| タイトル |
|
|
タイトル |
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
翻訳・マルチモーダル |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
立命館大学大学院情報理工学研究科 |
| 著者所属 |
|
|
|
京都大学学術情報メディアセンター |
| 著者所属 |
|
|
|
京都大学学術情報メディアセンター |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科/京都大学学術情報メディアセンター |
| 著者名 |
井上, 昂治
若林, 佑幸
吉本, 廣雅
高梨, 克也
河原, 達也
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
学会やオープンラボなどでなされるポスターセッションにおける会話を対象として,各会話参与者がいつ発話したかという情報 (話者区間) とそのうちの相槌を検出する手法を述べる.実際のポスター会話では,自然な話し言葉や周囲の騒音などにより検出精度が低下する.著者らは話者区間検出において,従来法で用いられてきた音響情報に対して,会話における発話権取得で重要な役割を担う視線情報を統合するマルチモーダルな手法を提案している.本稿では,視線特徴量と確率的統合モデルについて検討・改善を行った.また,検出した聴衆の発話区間が相槌であるかを,話者区間検出と同様のマルチモーダルな手法で判定し,相槌を発話区間から除去することで質問やコメントなどの発話のみを抽出する.実験結果から,音響情報と視線情報を統合することで雑音環境下での検出精度の向上が確認された. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2015-SLP-105,
号 9,
p. 1-6,
発行日 2015-02-20
|
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |