WEKO3
アイテム
大語彙連続音声認識と音節<i>N</i>-best音声認識を用いたSpoken Term Detectionの高精度化
https://ipsj.ixsq.nii.ac.jp/records/102201
https://ipsj.ixsq.nii.ac.jp/records/102201009f5f24-4c00-43fb-86f1-4651c8e914da
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-07-17 | |||||||
タイトル | ||||||||
タイトル | 大語彙連続音声認識と音節<i>N</i>-best音声認識を用いたSpoken Term Detectionの高精度化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of Spoken Term Detection by Combining LVCSR and Syllable-based N-best Speech Recognition Results | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所/現在,国立大学法人静岡大学大学院情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research-Tokyo, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research-Tokyo, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research-Tokyo, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research-Tokyo, IBM Japan Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research-Tokyo, IBM Japan Ltd. / Presently with Graduate School of Infomatics, Shizuoka University | ||||||||
著者名 |
長野, 徹
× 長野, 徹
|
|||||||
著者名(英) |
Tohru, Nagano
× Tohru, Nagano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 企業のコールセンターでは,音声通話に含まれる特定のキーワードをチェックするコールモニタリング業務によりコールセンターの品質向上を図っている.一部のコールセンターでは,大語彙連続音声認識技術の利用により日々大量に蓄積される音声データに対するキーワード検索が可能となってきた.ここでは,検索キーワードや業務内容に応じて,再現率を重視したい,適合率を重視したいといった要望がある.本報告では,認識単位の異なる二種類の音声認識システムを用いることで,単にキーワード検出区間を出力するだけではなく各検出区間に対して信頼度のスコアを与え,検索時に再現率・適合率のバランスを調整できるシステムを提案する.提案法では,大語彙連続音声認識を用いて検索キーワード文字列に一致する区間をキーワード検出区間候補として抽出し,それら検出区間に含まれる音節音声認識の N-best 出力と検索キーワード音節列とを比較することで,各検出区間をスコアリングする.実験では認識尤度によるスコアリングを用いた結果との比較を行い,本手法の有効性を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In contact centers, it is common to check the call conversations of the call agents with the customers for quality monitoring. Recently, more and more companies have come to use Automatic Speech Recognition (ASR) in call quality monitoring to enable exhaustive search in the calls. Preferences on the search results varies according to the demands; sometimes high recall rates are preferred, and at other times, high precision rates are preferred. Hence, in this paper, we propose a method that not only finds occurrences in the speech data of given search terms, but also gives confidence scores for the found occurrences by combining the recognition results of a word-based Large Vocabulary Continuous Speech Recognition (LVCSR) system and a syllable-based speech recognition system. While the former system is used for finding candidates, the latter system is used for calculating the confidence scores based on the N-best hypotheses. We present experimental results in which the proposed system outperformed a conventional method based on acoustic likelihood in performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2014-SLP-102, 号 10, p. 1-6, 発行日 2014-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |