@techreport{oai:ipsj.ixsq.nii.ac.jp:00057466, author = {李晃伸 and 河原, 達也 and 鹿野, 清宏 and Akinobu, Lee and Tatsuya, Kawahara and Kiyohiro, Shikano}, issue = {119(2000-SLP-034)}, month = {Dec}, note = {音素環境非依存のモノフォンモデルの尤度に基づいてトライフォンの予備選択を行うことで,大語彙連続音声認識における音響尤度計算量を高速化する手法を提案する.フレームごとに全モノフォン状態の尤度を計算し,上位の状態についてのみ,対応するより高い解像度のトライフォンモデルの尤度を計算するとともに,下位の状態に対応するトライフォンについてはモノフォンの尤度をそのまま割り付けることで,非計算状態に対しても信頼度の高いback-off尤度を与える.比較実験の結果,従来手法であるベクトル量子化に基づくガウス分布選択(Gaussian selection)と同等の性能を示し,さらに計算するガウス分布数を絞った条件下でも安定した性能が得られた.Phonetic tied-mixture (PTM)モデルとの組合わせで,精度をほとんど落とさずに音響尤度計算コストを全体の約14%に抑えることができた., We address a method to efficiently select Gaussian mixtures for fast acoustic likelihood computation. It makes use of context-independent models for selection and back-off of corresponding triphone models. Specifically, for the k-best phone models by the preliminary evaluation, triphone models of higher resolution are applied, and others are assigned likelihoods with the monophone models. This selection scheme assigns more reliable back-off likelihoods to the un-selected states than the conventional Gaussian selection based on a VQ codebook. Experimental results show that this method can achieves a comparable performance, and works much better under the aggressive pruning condition. Together with the phonetic tied-mixture (PTM) modeling, acoustic matching cost is reduced to almost 14% with little loss of accuracy.}, title = {モノフォンモデルを用いた状態選択に基づく音響尤度計算の高速化}, year = {2000} }