WEKO3
アイテム
音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定とそれを用いたエラー予測
https://ipsj.ixsq.nii.ac.jp/records/66401
https://ipsj.ixsq.nii.ac.jp/records/66401f7720eee-cfa8-4e20-8edd-ebf94ebbd952
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2009-10-16 | |||||||
| タイトル | ||||||||
| タイトル | 音声対話システムにおける暗黙的な教師信号に基づく音声認識率の推定とそれを用いたエラー予測 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Predicting Barge-in Utterance Errors by using Implicitly Supervised ASR Accuracy and Barge-in Rate per User | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 一般講演 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学大学院情報学研究科 | ||||||||
| 著者所属 | ||||||||
| School of Computer Science, Carnegie Mellon University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Informatics, Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| School of Computer Science, Carnegie Mellon University | ||||||||
| 著者名 |
駒谷, 和範
AlexanderI.Rudnicky
× 駒谷, 和範 AlexanderI.Rudnicky
|
|||||||
| 著者名(英) |
Kazunori, Komatani
Alexander, I.Rudnicky
× Kazunori, Komatani Alexander, I.Rudnicky
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 個々のユーザのふるまいのモデル化は,一般市民に向け公開され繰り返し使われる音声対話システムの性能を向上させるのに有望な方法のひとつである.我々は,システムの明示的な確認の後に続くユーザ応答を用いて,ユーザごとに,「暗黙的な教師信号に基づく」推定音声認識率を計算する.この推定音声認識率を,そのユーザのシステムへの慣れを表すバージイン率と統合し,バージイン発話の誤り予測を行う.評価実験により,本稿で定義した推定音声認識率が,この誤り予測精度の向上に有用であることを示す.なおここで用いた推定音声認識率とバージイン率はともに実行時に計算可能であるため,人手による正解付与作業なしに誤り予測性能を向上させるのに用いることができる. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Modeling of individual users is a promising way of improving the performance of spoken dialogue systems deployed for the general public and utilized repeatedly. We define "implicitly-supervised" ASR accuracy per user on the basis of responses following the system's explicit confirmations. We combine the estimated ASR accuracy with the user's barge-in rate, which represents how well the user is accustomed to using the system, to predict interpretation errors in barge-in utterances. Experimental results showed that the estimated ASR accuracy improved prediction performance. Since this ASR accuracy and the barge-in rate are obtainable at runtime, they improve prediction performance without the need for manual labeling. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-78, 号 3, p. 1-5, 発行日 2009-10-16 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||