@techreport{oai:ipsj.ixsq.nii.ac.jp:00079345, author = {アブリミテ・ミジテ and 河原, 達也 and ハムヅラ・アスカ and Mijit, Ablimit and Tatsuya, Kawahara and Askar, Hamdulla}, issue = {2}, month = {Dec}, note = {日本語やウイグル語のような膠着言語では、単語の単位の定義が自明でない。音声認識の単位として形態素が一般的に用いられるが、多くの形態素が短いため、制約として弱く、誤認識の原因になる。我々は、識別学習に基づいて、音声認識誤りの削減に直結するような単語のエントリを選択する方法を提案している。本手法では、各単語エントリに対して、素性の集合とそれらの重みからなる評価関数、及び、形態素単位のモデルと単語単位のモデルの誤り率の差による誤分類尺度を定義した上で、パーセプトロン学習によって素性の重みを学習する。その上で、評価関数の値の高い単語もしくはサブワードのエントリを辞書に追加する。本手法をウイグル語の大語彙連続音声認識システムに適用し、(1) 有効な素性、(2) サブワードエントリの効果、に関して評価を行った。さらに、従来の頻度や相互情報量に基づく手法と比較した上で、それらとの組み合わせも検討した。, In agglutinative languages, selection of lexical unit is not obvious. Morpheme unit is usually adopted to ensure a sufficient coverage, but many morphemes are short, resulting in weak constraints and possible confusions. In this paper, we propose a discriminative approach to select lexical entries which will directly contribute to ASR error reduction. We define an evaluation function for each word by a set of features and their weights, and the measure for optimization by the difference of WERs by the morpheme-based model and by the word-based model. Then, the weights of the features are learned by a perceptron algorithm. Finally, word (or sub-word) entries with higher evaluation scores are selected to be added to the lexicon. This method is successfully applied to an Uyghur large-vocabulary continuous speech recognition system, resulting in a significant reduction of WER and the lexicon size. Further improvement is achieved by combining with a statistical method based on mutual information criterion.}, title = {識別学習に基づく音声認識単語辞書の最適化の評価}, year = {2011} }