WEKO3
アイテム
質問応答型検索の音声認識誤りに対するロバスト性向上
https://ipsj.ixsq.nii.ac.jp/records/48056
https://ipsj.ixsq.nii.ac.jp/records/48056c93fce1f-c168-4521-ab5c-4d5a624588ce
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-03-10 | |||||||
タイトル | ||||||||
タイトル | 質問応答型検索の音声認識誤りに対するロバスト性向上 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improving the Robustness to Recognition Errors in Speech Input Question Answering | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)東芝研究開発センター知識メディアラボラトリー | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター知識メディアラボラトリー | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター研究企画室 | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター知識メディアラボラトリー | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター知識メディアラボラトリー | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター知識メディアラボラトリー | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Knowledge Media Laboratory Corporate R&D Center TOSHIBA Corp. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Knowledge Media Laboratory Corporate R&D Center TOSHIBA Corp. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Planning Office Corporate R&D Center TOSHIBA Corp. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Knowledge Media Laboratory Corporate R&D Center TOSHIBA Corp. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Knowledge Media Laboratory Corporate R&D Center TOSHIBA Corp. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Knowledge Media Laboratory Corporate R&D Center TOSHIBA Corp. | ||||||||
著者名 |
筒井, 秀樹
真鍋, 俊彦
福井, 美佳
藤井, 寛子
浦田, 耕二
酒井, 哲也
× 筒井, 秀樹 真鍋, 俊彦 福井, 美佳 藤井, 寛子 浦田, 耕二 酒井, 哲也
|
|||||||
著者名(英) |
Hideki, Tsutsui
Toshihiko, Manabe
Mika, Fukui
Hiroko, Fujii
Koji, Urata
Tetsuya, Sakai
× Hideki, Tsutsui Toshihiko, Manabe Mika, Fukui Hiroko, Fujii Koji, Urata Tetsuya, Sakai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々はこれまで,質問応答型マルチモーダルヘルプシステムの開発を行ってきた.これはユーザからの質問に対し,映像・音声・取扱説明(テキスト)などで構成される表現力豊かなマルチモーダルコンテンツの検索技術,および,質問内容を理解し,ユーザが必要としている情報に対して的確に回答する質問応答技術を融合することにより,よりわかりやすい情報提供を実現したシステムである.この中で,音声入力による質問を処理する際,音声認識誤りが起きると,その後の処理がうまく行かず,適切な回答が出来ない場合があった.失敗原因を検討した結果,具体的な時間や量をきくFactoid型の質問に対する音声認識誤りの影響が大きいことがわかった.これは,音声認識誤りによって疑問詞についての情報が失われることにより,具体的に何を回答すべきかを判定する回答タイプ判定に失敗することが原因であった.そこで今回,音声認識誤りに対するロバスト性向上を目的とし,回答タイプが正しく判定されるように,音声認識結果を補完して検索する手法を開発した.その結果,上位3位までのMRR(Mean Reciprocal Rank)による検索精度で,従来手法が0.429であったのに対し,今回の手法では0.597に向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have been developing a multimodal question answering system that combines the search technol-ogy for multimodal contents with high expressive power such as video, speech and text, and the factoid question answering technology for understanding the user's information need and extracting exact an-swers from text. Failure analyses of our system showed that speech recognition errors were fatal for answer type recognition and therefore for the final Mean Reciprocal Rank (MRR) performance, espe-cially with numerical factoid questions. We therefore propose a new method which is robust to speech recognition errors. This method improves our MRR based on top 3 answers from 0.429 to 0.597. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 22(2004-NL-166), p. 31-38, 発行日 2005-03-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |