WEKO3
アイテム
識別学習に基づく音声認識単語辞書の最適化の評価
https://ipsj.ixsq.nii.ac.jp/records/79345
https://ipsj.ixsq.nii.ac.jp/records/7934514f8e2c0-05df-4cf6-be6a-7b1635de9064
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-12 | |||||||
タイトル | ||||||||
タイトル | 識別学習に基づく音声認識単語辞書の最適化の評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Evaluation of Lexicon Optimization based on Discriminative Learning | |||||||
言語 | ||||||||
言語 | eng | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 言語モデル・辞書 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学情報学研究科/新疆大学信息学院 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
新疆大学信息学院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University, Kyoto, Japan / Institute of Information Engineering, Xinjiang University, Urumqi, China | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University, Kyoto, Japan | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Information Engineering, Xinjiang University, Urumqi, China | ||||||||
著者名 |
アブリミテ・ミジテ
× アブリミテ・ミジテ
|
|||||||
著者名(英) |
Mijit, Ablimit
× Mijit, Ablimit
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 日本語やウイグル語のような膠着言語では、単語の単位の定義が自明でない。音声認識の単位として形態素が一般的に用いられるが、多くの形態素が短いため、制約として弱く、誤認識の原因になる。我々は、識別学習に基づいて、音声認識誤りの削減に直結するような単語のエントリを選択する方法を提案している。本手法では、各単語エントリに対して、素性の集合とそれらの重みからなる評価関数、及び、形態素単位のモデルと単語単位のモデルの誤り率の差による誤分類尺度を定義した上で、パーセプトロン学習によって素性の重みを学習する。その上で、評価関数の値の高い単語もしくはサブワードのエントリを辞書に追加する。本手法をウイグル語の大語彙連続音声認識システムに適用し、(1) 有効な素性、(2) サブワードエントリの効果、に関して評価を行った。さらに、従来の頻度や相互情報量に基づく手法と比較した上で、それらとの組み合わせも検討した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In agglutinative languages, selection of lexical unit is not obvious. Morpheme unit is usually adopted to ensure a sufficient coverage, but many morphemes are short, resulting in weak constraints and possible confusions. In this paper, we propose a discriminative approach to select lexical entries which will directly contribute to ASR error reduction. We define an evaluation function for each word by a set of features and their weights, and the measure for optimization by the difference of WERs by the morpheme-based model and by the word-based model. Then, the weights of the features are learned by a perceptron algorithm. Finally, word (or sub-word) entries with higher evaluation scores are selected to be added to the lexicon. This method is successfully applied to an Uyghur large-vocabulary continuous speech recognition system, resulting in a significant reduction of WER and the lexicon size. Further improvement is achieved by combining with a statistical method based on mutual information criterion. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2011-SLP-89, 号 2, p. 1-5, 発行日 2011-12-12 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |