2024-03-19T18:57:20Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000126972022-10-21T05:24:51Z00581:00703:00712
大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討A Study on a Phoneme -graph- based Hypothesis Restriction for Large Vocabulary Continuous Speech Recognitionjpn特集:音声言語情報処理http://id.nii.ac.jp/1001/00012697/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=12697&item_no=1&attribute_id=1&file_no=1Copyright (c) 1999 by the Information Processing Society of Japan大語彙連続音声認識山形大学工学部山形大学工学部山形大学工学部山形大学工学部山形大学工学部堀, 貴明岡, 直生加藤正治伊藤, 彰則好田, 正紀本論文では 大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition: LVCSR)のための高速な探索手法について検討し 効果的に探索空間を狭める新しい手法-音素グラフに基づく仮説制限法-を提案する. 本手法は 認識の前処理として音素グラフを生成し 認識段階ではその音素グラフの情報を利用して仮説の展開を制限しながら最良の単語列を探索する. 音素グラフによる仮説制限は 音素境界制限とForward-Backward Pruningからなり これらは探索空間の大幅な削減を可能にする. 語彙サイズ5000の新聞記事読み上げ音声を用いた認識実験において 本手法が誤り率を増加させることなく処理時間の約70%を削減可能であることが示された.In this paper, we study about fast search strategies for Large Vocabulary Continuous Speech Recognition (LVCSR), and propose a new method - a phoneme-graph-based hypothesis restriction, which effectually prunes the search space. In the proposed method, a phoneme graph is generated at the pre-processing stage, and then the best word sequence is searched while restricting expansion of hypotheses using the information of the phoneme graph at the main recognition stage. The phoneme-graph-based restriction consists of the limitation of phoneme boundaries and the Forward-Back ward Pruning, which enable to reduce the search space dramatically. The proposed method was tested on a 5,000-word Japanese newspaper reading task. The experimental results show that this method can reduce about 70% of the elapsed time without any error increasing.AN00116647情報処理学会論文誌404136513731999-04-151882-77642009-06-29