WEKO3
アイテム
大語彙連続音声認識エンジンJuliusにおける A * 探索法の改善
https://ipsj.ixsq.nii.ac.jp/records/57596
https://ipsj.ixsq.nii.ac.jp/records/5759653924fed-2dc7-4c01-8046-16617f9c1cca
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-07-23 | |||||||
タイトル | ||||||||
タイトル | 大語彙連続音声認識エンジンJuliusにおける A * 探索法の改善 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvements of A * - based search algorithm in LVCSR engine Julius | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者名 |
李晃伸
× 李晃伸
|
|||||||
著者名(英) |
Akinobu, Lee
× Akinobu, Lee
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 大語彙連続音声認識エンジンJuliusにおける解探索アルゴリズムの種々の改善手法を提案し,その評価を行う.ヒューリスティックの非適格性から生じる探索誤りや探索失敗を解消するために,第2パスで探索が幅優先に陥るのを防ぐenveloped best-first探索を提案するとともに,第1パスで単語間triphoneを近似計算することで探索の高精度化を図る.高速化の面からは,第2パスの音響尤度計算におけるスコアでのビーム設定と,第1パスでの1-gram確率に基づくfactoringを導入する.JNASの20 000語タスクでの評価実験の結果探索誤りの多くが解消され,またその精度を落とさずに計算量を削減することができた.最終的に,実時間の12.9倍で94.9%,monophoneではほぼ実時間で84.2%の単語認識精度を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The recent improvements in our LVCSR engine "Julius" are shown. To ease search errors and search failure caused by dis-optimality of heuristics, an enveloped best-first search algorithm and an approximation of the inter-word context dependency on the 1st pass are proposed. More, score-based envelope beam for aoustic scanning on the 2nd pass and 1-gram factoring are introduced to decrease computational costs. Experiments on 20,000-word JNAS task show that most of the search errors are dissolved and the costs can be efficiently cut with little accuracy loss. The system achieved word accuracy of 94.9% in a real-time factor of 12.9, and using monophone model, 84.2% in nearly real-time. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 64(1999-SLP-027), p. 33-40, 発行日 1999-07-23 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |