WEKO3
アイテム
話者適応と雑音混合モデル推定の同時適用による雑音抑圧
https://ipsj.ixsq.nii.ac.jp/records/79363
https://ipsj.ixsq.nii.ac.jp/records/793634ae9f718-79cf-4f06-bbc8-3ed4ece7903a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2011 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
SLP:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-12 | |||||||
タイトル | ||||||||
タイトル | 話者適応と雑音混合モデル推定の同時適用による雑音抑圧 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Simultaneous application of speaker adaptation and noise mixture model estimation for noise suppression | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 耐雑音処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話(株) NTT コミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話(株) NTT コミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
日本電信電話(株) NTT コミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories, NTT Corporation | ||||||||
著者名 |
藤本, 雅清
× 藤本, 雅清
|
|||||||
著者名(英) |
Masakiyo, Fujimoto
× Masakiyo, Fujimoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では,確率モデルに基づく雑音抑圧法において,話者適応と雑音混合分布モデルの推定を同時に実施することにより,非定常雑音下での音声認識性能の大幅な改善が得られることを示す.確率モデルに基づく雑音抑圧法では話者依存の音声モデルと,混合分布に基づく雑音モデルを利用することが理想とされるが,これをそのまま厳密に扱うことは極めて困難な問題である.この問題に対して,本研究では,観測信号よりクリーン音声信号と雑音信号の最小平均二乗誤差推定値を用いることにより,話者独立モデルの話者適応と,雑音の混合分布モデル推定を同時に実施する手法を提案する.提案手法により,従来法に比べて最大 14% の音声認識性能を改善することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a joint processing method for a model-based noise suppression that simultaneously achieves speaker adaptation and noise mixture model estimation. Although ideal models for the model-based noise suppression are a speaker-dependent speech model and a noise model consisted of a mixture model, it is unrealistic scenario. To overcome this problem, the proposed method realizes a joint processing of speaker adaptation for speaker-independent speech model and noise mixture model estimation by using minimum mean squared error estimates of clean speech and noise. The proposed method significantly outperformed the conventional method, and the maximum improvement in the word error rate was about 14%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2011-SLP-89, 号 20, p. 1-6, 発行日 2011-12-12 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |