@techreport{oai:ipsj.ixsq.nii.ac.jp:00056981, author = {木田, 祐介 and 河原, 達也 and Yusuke, Kida and Tatsuya, Kawahara}, issue = {69(2005-SLP-057)}, month = {Jul}, note = {複数の特徴を重み付き統合し、さらに重みを最適化することにより種々の雑音に頑健な発話区間検出(VAD)を実現する手法を提案する。提案手法では、VADの代表的な特徴である振幅レベル、ゼロ交差数、スペクトル情報、GMM対数尤度の4つを統合的に用いる。これらの特徴の統合は、雑音環境に応じて最適な特徴を選択することを事実上包含しており、また統合重みを最適化することによりさらに検出性能の向上が期待できる。統合重みの最適化には最小誤り分類(MCE)学習を用いる。3種類の雑音環境下での実験により、提案手法の雑音への頑健性を確認した。また重みの最適化が実際に検出性能を改善すること、また数回程度の発話で雑音環境に適応できることがわかった。, This paper presents a voice activity detection (VAD) scheme that is robust against noise, based on an optimally weighted combination of features. The scheme uses a weighted combination of four conventional VAD features: amplitude level, zero crossing rate, spectral information, and Gaussian mixture model likelihood. This combination in effect selects the optimal method depending on the noise condition. The weights for the combination are updated using minimum classification error (MCE) training. An experimental evaluation under three types of noisy environment demonstrated the noise robustness of our proposed method. Adapting the feature weights was shown to enhance the detection ability and to be possible using a few training utterance.}, title = {複数特徴の重み付き統合による雑音に頑健な発話区間検出}, year = {2005} }