WEKO3
アイテム
尤度最大化規準による雑音適応
https://ipsj.ixsq.nii.ac.jp/records/57365
https://ipsj.ixsq.nii.ac.jp/records/5736596024dba-b698-4a76-9589-155004a68102
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-02-01 | |||||||
タイトル | ||||||||
タイトル | 尤度最大化規準による雑音適応 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Piecewise - Linear Transformation - based HMM Adaptation for Noisy Speech | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学大学院情報理工学研究科計算工学専攻 | ||||||||
著者所属 | ||||||||
東京工業大学大学院情報理工学研究科計算工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Tokyo Institute of Technology | ||||||||
著者名 |
張志鵬
× 張志鵬
|
|||||||
著者名(英) |
Zhipeng, Zhang
× Zhipeng, Zhang
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 尤度最大化規準による音素HMMの雑音適応を実現するため、非線形処理を区分線形変換で近似する方法を提案する。雑音重畳音声のHMMパラメータ空間を区分化し、入力音声の条件に最も適合した部分空間を選ぶ。選ばれた空間で、尤度がさらに最大化するように線形変換(MLLR)を行う。また、MLLRにおける分散の適応効果を考察する。二種類の雑音データ(人工的に付加した雑音音声と 実際に放送されたニュース音声で背景に多種の雑音や音楽が乗っている雑音音声)に対する評価実験によって提案手法の有効性を確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a piecewise-linear transformation method for noise adaptation of phone HMM. Various noises are clustered according to their acoustical property and signal-to-noise ratios (SNRs), and noisy speech HMM is made for each clustered noise condition. Based on the likelihood maximization criterion, the HMM which best matches an input speech is selected and further adapted using the MLLR method. The proposed method was evaluated by recognizing noisy broadcast-news speech. It was confirmed that the proposed method was effective in recognizing numerically noise-added speech as well as actual noisy speech uttered by a wide range of speakers under various noise conditions. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2002, 号 10(2001-SLP-040), p. 157-160, 発行日 2002-02-01 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |