WEKO3
アイテム
ドメイン内の信頼度と談話の整合性を用いた音声認識誤りの検出
https://ipsj.ixsq.nii.ac.jp/records/56979
https://ipsj.ixsq.nii.ac.jp/records/569799a04289b-5d06-4adb-a80c-0e2aaf667e32
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-07-15 | |||||||
| タイトル | ||||||||
| タイトル | ドメイン内の信頼度と談話の整合性を用いた音声認識誤りの検出 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Incorporating In-domain Confidence and Discourse Coherence Measures in Utterance Verification | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学 情報学研究科 知能情報学専攻/ATR 音声言語コミュニケーション研究所 | ||||||||
| 著者所属 | ||||||||
| 京都大学 情報学研究科 知能情報学専攻/ATR 音声言語コミュニケーション研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics, Kyoto University/ATR Spoken Language Translation Laboratories | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics, Kyoto University/ATR Spoken Language Translation Laboratories | ||||||||
| 著者名 |
レーン, イアン
河原, 達也
× レーン, イアン 河原, 達也
|
|||||||
| 著者名(英) |
Ian, R.Lane
Tatsuya, Kawahara
× Ian, R.Lane Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 音声認識結果の信頼度尺度に関する従来研究は、一般に音声認識デコーダから直接得られる単語尤度などの`低次の'情報に基づいている。それに対して、`高次の'知識に基づいた信頼度尺度を用いる発話検証手法を提案する。本稿では、ドメイン内の信頼度尺度(発話がシステムの扱うドメイン内である信頼度)と、談話の整合性に関する信頼度尺度(対話における発話の関連性・一貫性に関する尺度)を提案する。これらの2つの提案手法を、従来より広く用いられている一般化事後確率(GPP: generalized posterior probability)と組み合わせることによって、総合的な信頼度尺度を求める。ATR の音声翻訳システムを介した自然対話音声を用いて評価実験を行った結果、実際に認識誤り検出性能の改善が得られた。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Conventional confidence measures for assessing the reliability of ASR output are typically derived from `low-level' information which is obtained during speech recognition decoding. In contrast to these approaches, we propose a novel utterance verification scheme which incorporates confidence measures derived from `high-level' knowledge sources. Specifically, we investigate two measures: in-domain confidence, the degree of match between the input utterance and the application domain of the back-end system, and discourse coherence, the consistency between consecutive utterances in a dialogue session. A joint verification confidence is generated by combining these two measures with an orthodox measure based on GPP (generalized posterior probability). The proposed verification scheme was evaluated on spontaneous dialogue via the ATR speech-to-speech translation system. The two proposed measures were effective in improving verification accuracy. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 69(2005-SLP-057), p. 37-42, 発行日 2005-07-15 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||