WEKO3
アイテム
変分ベイズ法の自由エネルギーを用いた雑音に頑健なオンライン発話区間検出
https://ipsj.ixsq.nii.ac.jp/records/56789
https://ipsj.ixsq.nii.ac.jp/records/56789326a8643-0942-42b0-b368-fc78bd70b0cf
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-12-20 | |||||||
タイトル | ||||||||
タイトル | 変分ベイズ法の自由エネルギーを用いた雑音に頑健なオンライン発話区間検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Using Variational Bayes Free Energy for Noise Robust Online Voice Activity Detection | |||||||
言語 | ||||||||
言語 | eng | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Informatics, Kyoto University | ||||||||
著者名 |
クナーポ, ダビド
× クナーポ, ダビド
|
|||||||
著者名(英) |
David, COURNAPEAU
× David, COURNAPEAU
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、雑音に頑健な発話区間検出の問題を扱っている。従来の発話区間検出ではヒューリスティックな状態機械が一般的に用いられているが、この代替として、識別器のオンライン EM 学習に変分ベイズ法のアプローチを導入することを提案する。変分ベイズ法では、モデルのデータに対する証拠の近似として自由エネルギーが得られる。この自由エネルギーは、識別器の信頼性の尺度として用いることができ、しかも少数のサンプルで更新することができる。本研究ではこれを利用して、雑音のみからなる区間を検出し、従来法のようにヒューリスティックに依存しない形で、より信頼性の高い発話区間検出の実現を図る。CENSREC-1-C データベースを用いた評価実験の結果、提案する手法により有意な改善を得ることができた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The problem of Voice Activity Detection (VAD) is addressed. This paper proposes to use Variational Bayes Expectation Maximization for classification as a replacement of heuristic-based state machines for online classification. Because the Variational Bayes framework provides an explicit approximation of the evidence of the model, and can be updated with a small number of samples. It can be used to assess the reliability of the classification model by comparing different alternative models. This model comparison is then used for the detection of invalid classification in noise-only portions for more reliable VAD. The method is evaluated on the CENSREC-1-C database for VAD evaluation, and the proposed method gives a significant improvement compared to a previously presented method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2007, 号 129(2007-SLP-069), p. 207-212, 発行日 2007-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |