WEKO3
アイテム
複数特徴の重み付き統合による雑音に頑健な発話区間検出
https://ipsj.ixsq.nii.ac.jp/records/56981
https://ipsj.ixsq.nii.ac.jp/records/56981c2428dfb-53d0-423c-818a-bcc77abad7be
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-07-15 | |||||||
| タイトル | ||||||||
| タイトル | 複数特徴の重み付き統合による雑音に頑健な発話区間検出 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Voice Activity Detection based on Optimally Weighted Combination of Multiple Features | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学 | ||||||||
| 著者所属 | ||||||||
| 京都大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Scholl of Informatics ,Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Scholl of Informatics ,Kyoto University | ||||||||
| 著者名 |
木田, 祐介
河原, 達也
× 木田, 祐介 河原, 達也
|
|||||||
| 著者名(英) |
Yusuke, Kida
Tatsuya, Kawahara
× Yusuke, Kida Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 複数の特徴を重み付き統合し、さらに重みを最適化することにより種々の雑音に頑健な発話区間検出(VAD)を実現する手法を提案する。提案手法では、VADの代表的な特徴である振幅レベル、ゼロ交差数、スペクトル情報、GMM対数尤度の4つを統合的に用いる。これらの特徴の統合は、雑音環境に応じて最適な特徴を選択することを事実上包含しており、また統合重みを最適化することによりさらに検出性能の向上が期待できる。統合重みの最適化には最小誤り分類(MCE)学習を用いる。3種類の雑音環境下での実験により、提案手法の雑音への頑健性を確認した。また重みの最適化が実際に検出性能を改善すること、また数回程度の発話で雑音環境に適応できることがわかった。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper presents a voice activity detection (VAD) scheme that is robust against noise, based on an optimally weighted combination of features. The scheme uses a weighted combination of four conventional VAD features: amplitude level, zero crossing rate, spectral information, and Gaussian mixture model likelihood. This combination in effect selects the optimal method depending on the noise condition. The weights for the combination are updated using minimum classification error (MCE) training. An experimental evaluation under three types of noisy environment demonstrated the noise robustness of our proposed method. Adapting the feature weights was shown to enhance the detection ability and to be possible using a few training utterance. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 69(2005-SLP-057), p. 49-54, 発行日 2005-07-15 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||