ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2011
  4. 2011-SLP-089

識別学習に基づく音声認識単語辞書の最適化の評価

https://ipsj.ixsq.nii.ac.jp/records/79345
https://ipsj.ixsq.nii.ac.jp/records/79345
14f8e2c0-05df-4cf6-be6a-7b1635de9064
名前 / ファイル ライセンス アクション
IPSJ-SLP11089002.pdf IPSJ-SLP11089002.pdf (268.5 kB)
Copyright (c) 2011 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2011-12-12
タイトル
タイトル 識別学習に基づく音声認識単語辞書の最適化の評価
タイトル
言語 en
タイトル Evaluation of Lexicon Optimization based on Discriminative Learning
言語
言語 eng
キーワード
主題Scheme Other
主題 言語モデル・辞書
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学情報学研究科/新疆大学信息学院
著者所属
京都大学情報学研究科
著者所属
新疆大学信息学院
著者所属(英)
en
School of Informatics, Kyoto University, Kyoto, Japan / Institute of Information Engineering, Xinjiang University, Urumqi, China
著者所属(英)
en
School of Informatics, Kyoto University, Kyoto, Japan
著者所属(英)
en
Institute of Information Engineering, Xinjiang University, Urumqi, China
著者名 アブリミテ・ミジテ 河原, 達也 ハムヅラ・アスカ

× アブリミテ・ミジテ 河原, 達也 ハムヅラ・アスカ

アブリミテ・ミジテ
河原, 達也
ハムヅラ・アスカ

Search repository
著者名(英) Mijit, Ablimit Tatsuya, Kawahara Askar, Hamdulla

× Mijit, Ablimit Tatsuya, Kawahara Askar, Hamdulla

en Mijit, Ablimit
Tatsuya, Kawahara
Askar, Hamdulla

Search repository
論文抄録
内容記述タイプ Other
内容記述 日本語やウイグル語のような膠着言語では、単語の単位の定義が自明でない。音声認識の単位として形態素が一般的に用いられるが、多くの形態素が短いため、制約として弱く、誤認識の原因になる。我々は、識別学習に基づいて、音声認識誤りの削減に直結するような単語のエントリを選択する方法を提案している。本手法では、各単語エントリに対して、素性の集合とそれらの重みからなる評価関数、及び、形態素単位のモデルと単語単位のモデルの誤り率の差による誤分類尺度を定義した上で、パーセプトロン学習によって素性の重みを学習する。その上で、評価関数の値の高い単語もしくはサブワードのエントリを辞書に追加する。本手法をウイグル語の大語彙連続音声認識システムに適用し、(1) 有効な素性、(2) サブワードエントリの効果、に関して評価を行った。さらに、従来の頻度や相互情報量に基づく手法と比較した上で、それらとの組み合わせも検討した。
論文抄録(英)
内容記述タイプ Other
内容記述 In agglutinative languages, selection of lexical unit is not obvious. Morpheme unit is usually adopted to ensure a sufficient coverage, but many morphemes are short, resulting in weak constraints and possible confusions. In this paper, we propose a discriminative approach to select lexical entries which will directly contribute to ASR error reduction. We define an evaluation function for each word by a set of features and their weights, and the measure for optimization by the difference of WERs by the morpheme-based model and by the word-based model. Then, the weights of the features are learned by a perceptron algorithm. Finally, word (or sub-word) entries with higher evaluation scores are selected to be added to the lexicon. This method is successfully applied to an Uyghur large-vocabulary continuous speech recognition system, resulting in a significant reduction of WER and the lexicon size. Further improvement is achieved by combining with a statistical method based on mutual information criterion.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2011-SLP-89, 号 2, p. 1-5, 発行日 2011-12-12
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 20:15:19.850882
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3