WEKO3
アイテム
長時間パワースペクトル減算による雑音下音声認識
https://ipsj.ixsq.nii.ac.jp/records/57452
https://ipsj.ixsq.nii.ac.jp/records/57452ab9c2d33-a657-4c3d-88be-3b67bd3fcdc8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-12-21 | |||||||
タイトル | ||||||||
タイトル | 長時間パワースペクトル減算による雑音下音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | LONG - TERM EFFECT REMOVAL FOR NOISY SPEECH RECOGNITION | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
グリフィス大学/ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
グリフィス大学/ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Microelectronic Engineering, Griffith University/ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Microelectronic Engineering, Griffith University/ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者名 |
J.チェン
× J.チェン
|
|||||||
著者名(英) |
J., Chen
× J., Chen
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、雑音下の音声認識に対する関心は高まっている。一般に音声認識システムの雑音に対する頑健性の向上には、1.雑音区間の検出と同定、2.認識処理中の雑音の取り扱いについて検討する必要がある。本稿では、長時間フーリエ分析を用いて雑音の影響を推定する方法を提案する。次いで、歪んだ音声から、その雑音の影響を除去する方法について述べる。この方法は、基本的には従来のスペクトル・サブトラクションと同様の処理である。雑音が混入した観測信号の短時間パワースペクトルから、その長時間パワースペクトルを差し引いたものを特徴量とすることで、雑音の影響を受けない認識を行う。従来法の連続スペクトル・サブトラクションでは、短時間パワースペクトルの長時間平均が用いられるが、本方法ではその代わりに長時間パワースペクトルを用いることで、音声認識で重要な音韻の識別的な情報を保ち、かつ雑音の影響を除去したスペクトルのより良い推定を得る。本稿ではDARPAの雑音環境における評価用のデータベース(SPINE)を用いて認識実験を行い、本方法の効果を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Noise speech recognition is of great interests in speech research recently. To make an automatic speech recognition system robust to noise, we will probably have to solve two problems. One is the detection and identification of noise. Another is the consideration of noise effect during recognition process. In this paper, we will address a new method to estimate the noise effect using a long-term Fourier analysis. We will then discuss how to remove the noise effect from corrupted speech to make recognition system immune to uncertainties. The rationale behind our noise estimation and removal approach can be described as follows. Speech signal is a non-stationary stochastic proccss. Much phonetic information in speech is encoded in the changes of the speech spectrum over time. Relatively less phonetic information is encapsulated in the long-term specch spectrum. Noise, however can be treated as a stationary process. Long-term spectrum will provide a good estimate of noise. Hence the subtraction of long-term effect from short-term spectra will keep the discrimination information which is neccssary for speech recognition, and meanwhile remove the noise effect. We will report on experiments on DARPA speech in noise environments evaluation (SPINE) database to demonstrate the properties of the proposed approach. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 119(2000-SLP-034), p. 13, 発行日 2000-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |