@techreport{oai:ipsj.ixsq.nii.ac.jp:00057078, author = {南條浩輝 and 河原, 達也 and Hiroaki, Nanjo and Tatsuya, Kawahara}, issue = {131(2004-SLP-054)}, month = {Dec}, note = {ドメインを限定しない自然な話し言葉の音声理解を目的とした音声認識の評価尺度とそれに基づくデコーディング手法を提案する.従来,音声認識の一般的な評価尺度として,全ての単語を一様に扱う「単語誤り率(word error rate: WER)」が用いられてきた.これに対して,情報検索の観点から各単語の重要度を考慮した「重みつきキーワード」誤り率(weighted keyword error rate: WKER)」を提案する.講演音声からの重要文抽出のタスクにおいて,重みつきキーワード誤り率が重要文抽出の制度と相関が高いことを示す.その上で,ベイズリスク最小化(Minimum Bayes-Risk: MBR)」の枠組みに基づいて,重みつきキーワード誤り率の最小化を行う音声認識を実現する.CSJの学会講演17講演を用いて評価を行い,提案する認識手法が重みつきキーワード誤り率及び重要文抽出精度の改善に効果があることを示す., A new evaluation measure of speech recognition and a decoding strategy for keyword-based open-domain speech understanding are presented. Conventionally, WER (word error rate) has been widely used as an evaluation measure of speech recognition, which treats all words in a uniform manner. In this paper, we define a weighted keyword error rate (WKER) which gives a weight on errors from a viewpoint of information retrieval. We first demonstrate that this measure is more appropriate for predicting the performance of key sentence indexing of oral presentations. Then, we formulate a decoding method to minimize WKER based on Minimum Bayes-Risk (MBR) framework, and show that the decoding method works reasonably for improving WKER and key sentence indexing.}, title = {音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング}, year = {2004} }