Item type |
Journal(1) |
公開日 |
2015-08-15 |
タイトル |
|
|
タイトル |
大語彙連続音声認識と音節N-best音声認識を用いたキーワード検索の高精度化 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Improvement of Spoken Term Detection by Combining LVCSR and Syllable-based N-best Speech Recognition Results |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 音声認識,音声検索語検出,音節音声認識 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所/現在,国立大学法人静岡大学大学院総合科学技術研究科 |
著者所属(英) |
|
|
|
en |
|
|
IBM Research-Tokyo, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Research-Tokyo, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Research-Tokyo, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Research-Tokyo, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Research-Tokyo, IBM Japan Ltd. / Presently with Graduate School of Integrated Science and Technology, Shizuoka University |
著者名 |
長野, 徹
倉田, 岳人
鈴木, 雅之
立花, 隆輝
西村, 雅史
|
著者名(英) |
Tohru, Nagano
Gakuto, Kurata
Masayuki, Suzuki
Ryuki, Tachibana
Masafumi, Nishimura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
企業のコールセンターでは,音声通話に含まれる特定のキーワードを含む発言をチェックするコールモニタリング業務によりコールセンターの品質向上を図っている.一方,一部のコールセンターでは,大語彙連続音声認識技術の利用により日々大量に蓄積される音声データに対するキーワード検索が可能となってきた.このような現場では,検索キーワードや業務内容に応じて,「再現率を重視したい」,「適合率を重視したい」といった要望がある.本論文では,認識単位の異なる2種類の音声認識システムを用いて,各検出区間に対して信頼度を与え,検索時に再現率・適合率のバランスを調整できるシステムを提案する.提案法では,大語彙連続音声認識を用いてキーワード文字列に一致する区間を検出し,それら区間に含まれる音節音声認識のN-best出力と検索キーワード音節列とを比較することで検出区間に信頼度を与える.実験では,大語彙連続音声認識システム単体および音節音声認識システム単体のみを用いた場合との比較を行った.その結果,2種類の音声認識システムの組合せにより,誤認識音声の検出を42.1%~76.7%減らすことができ,本手法の有効性を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In contact centers, it is common to check the call conversations of the call agents with the customers for quality monitoring. Recently, more and more companies have come to use Automatic Speech Recognition (ASR) in call quality monitoring to enable exhaustive search in the calls. Preferences on the search results vary according to the searched keywords and the purpose of the search; sometimes high recall rates are preferred, and at other times, high precision rates are preferred. Hence, in this paper, we propose a method that not only finds occurrences in the speech data of given search terms, but also gives confidence scores for the found occurrences by combining the recognition results of a word-based Large Vocabulary Continuous Speech Recognition (LVCSR) system and a syllable-based speech recognition system. While the former system is used for finding candidates, the latter system is used for calculating the confidence scores based on the N-best hypotheses. The experimental results show that the proposed method reduce 42.1%-76.7% false-positive error by combining LVCSR and the syllable-based speech recognition system. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 56,
号 8,
p. 1646-1656,
発行日 2015-08-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |