WEKO3
アイテム
サブワードモデルを用いた未登録語認識の効率的探索手法
https://ipsj.ixsq.nii.ac.jp/records/11549
https://ipsj.ixsq.nii.ac.jp/records/115496c7538c3-0bd0-4e74-a997-418a6aafcbdb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-07-15 | |||||||
タイトル | ||||||||
タイトル | サブワードモデルを用いた未登録語認識の効率的探索手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Decoding Method for OOV Words Recognition with Subword Models | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:音声言語情報処理とその応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 音声認識用言語モデル | |||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs. | ||||||||
著者名 |
小窪, 浩明
× 小窪, 浩明
|
|||||||
著者名(英) |
Hiroaki, Kokubo
× Hiroaki, Kokubo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,未登録語を含む音声の認識を可能とするクラス依存サブワードモデルを効率的にデコードする手法として,サブワードネットワークを用いたデコーダを提案した.提案したデコーダを従来の単語N-gramベースのデコーダと比較したところ,認識性能を劣化させることなく言語モデルのデータサイズを1/40にし,46%の処理量削減を実現した.また,提案したサブワードネットワークの構造を応用し,日本人姓/名を対象としたモデル化に有効と思われる言語的特徴量について検討した.評価用音声データに出現する未登録語の認識実験の結果,サブワードbigramのみでモデル化した場合に比べ,モーラ長確率や単語終端位置での生起確率を特徴量に追加することで,未登録語の正解数が約15%向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Class dependent subword models were found to be effective for recognizing OOV (out-of-vocabulary) words.This paper proposes a novel decoder that efficiently handles the models.Compared with previous decoder,the proposed method achieves language model size of 1/40,and 46% reduction in CPU time without any deterioration of performance.Then, using the structure of subword networks,we examine feature parameters of subword models,which are applied to Japanese family/personal name.The result of speech recognition for OOV words indicates that by using of additional characteristics (e.g., duration or occurrence probability in word-end),the number of correctly recognized OOV words was improved by about 15%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 43, 号 7, p. 2082-2090, 発行日 2002-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |