WEKO3
アイテム
文法カテゴリ対制約を用いたA*探索に基づく 大語彙連続音声認識パーザ
https://ipsj.ixsq.nii.ac.jp/records/57652
https://ipsj.ixsq.nii.ac.jp/records/5765205b4c829-cfd4-4a8c-a3bf-93a830da2037
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-12-10 | |||||||
タイトル | ||||||||
タイトル | 文法カテゴリ対制約を用いたA*探索に基づく 大語彙連続音声認識パーザ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Large Vocabulary Continuous Speech Recognition Parser based on A* Search using Grammar Category - Pair Constraint | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics Kyoto University | ||||||||
著者名 |
李晃伸
× 李晃伸
|
|||||||
著者名(英) |
Akinobu, Lee
× Akinobu, Lee
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 大語彙の文法ベースの連続音声認識では,探索時に仮説の単語ネットワークが爆発する,また文法による単語の絞り込みも不十分である.これに対して(1)元の文法から抽出した単語(カテゴリ)対制約によってネットワークの大きさを抑え,かつ(2)文法カテゴリごとに単語辞書を木構造化することで,効率的に強力なヒューリスティック計算を行なう.さらに(3)この第1パスの結果をインデックス化しそれを元に展開単語を絞り込むことで,大語彙で効率の良いA^*探索を実現する.認識実験の結果,提案手法を用いた汎用連続音声認識パーザJulianは,標準的な1パスビーム探索に比べて計算量がはるかに少なくて済み,また複雑なネットワークに対しても安定して動作することが示された.最終的な性能は,800語のタスクでほぼ実時間で97.1%,5 000語のタスクでは実時間の2倍強で91.2%の単語認識精度を達成した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In grammar-based LVCSR, the expanded word hypothesis network grows enormously and the grammar only is not enough for word prediction. We propose an efficient two-pass search algorithm by (1)using word(category)-pair constraint as heuristics and (2)tree-organizing the word lexicon for each grammar category, both to represent the whole network in a compact loop structure. Futhermore, (3)the survived words on the first pass are indexed to eliminate candidates to be accessed on the second pass. Experimental results show that our depeloped portable FSA-based parser, named Julian, shows greater performance in costs and stability than a typical one-pass beam decoder. Finally, our parser archieved a word accuracy of 97.1% with almost real time processing on a 800-word task, and 91.2% with 2.5 times the real time on a 5000-word task. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1998, 号 114(1998-SLP-024), p. 105-112, 発行日 1998-12-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |