WEKO3
アイテム
Kernel PCAを用いた残響下におけるロバスト特徴量抽出の検討
https://ipsj.ixsq.nii.ac.jp/records/10265
https://ipsj.ixsq.nii.ac.jp/records/10265e50d7c1e-e00c-41bc-ad78-40f34ff693db
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-06-15 | |||||||
タイトル | ||||||||
タイトル | Kernel PCAを用いた残響下におけるロバスト特徴量抽出の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on Robust Feature Extraction Using Kernel PCA in Reverberant Environments | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:情報処理技術のフロンティア | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 音声言語 | |||||||
著者所属 | ||||||||
神戸大学工学部 | ||||||||
著者所属 | ||||||||
神戸大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Kobe University | ||||||||
著者名 |
滝口, 哲也
× 滝口, 哲也
|
|||||||
著者名(英) |
Tetsuya, Takiguchi
× Tetsuya, Takiguchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,Kernel PCA(Principal Component Analysis)を用いた雑音や残響にロバストな特徴量抽出手法について検討する.画像の分野では,Kernel PCA は雑音除去などに優れた性能を発揮することが知られている(Mika ら(1999)).たとえば,画質の粗い画像を高画質な画像へと変換を行うSuper-Resolution なども提案されている(Kim ら(2004)).一方,これまでKernel PCA を音声特徴量抽出において適用した研究も行われてきている.たとえばLima ら(2004 2005) では,クリーン音声に対してMFCC 計算後,音声のスペクトル包絡成分に対応する低次ケプストラムに対して,Kernel PCA を適用した結果が報告されている.これまで,様々な雑音除去手法について研究が行われてきているが,残響や非定常雑音などを完全に除去することは困難であり,まだ課題が残されている.従来の雑音除去手法の多くは,スペクトル領域において演算が行われ,認識時には,(対数スペクトルに対し)離散コサイン変換が適用され,特徴量としてケプストラムが使われる.本稿では,残響音声に対してロバストな特徴量抽出法として,離散コサイン変換の代わりにKernel PCA を用いた手法を提案し,残響下音声認識により,その有効性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We investigate robust feature extraction using kernel PCA (Principal Component Analysis). Kernel PCA has been suggested for various image processing tasks requiring an image model such as, e.g., denoising (Mika, et al. (1999)). Image denoising is the task of constructing a noise-free image from a noisy input image. From the point of view of a kernel PCA, image denoising can be also regarded as the same problem as image super-resolution (Kim, et al. (2004)). Also, an approach for feature extraction in speech recognition systems using kernel PCA has been proposed (Lima, et al. (2004, 2005)), where kernel PCA was applied to the low-dimension cepstrums. Much research for noise-robust feature extraction has been done, but it is difficult to remove the reverberation or non-stationary noise. The most commonly used noise-removal techniques are based on the spectral-domain operation, and then for the speech recognition MFCC (Mel Frequency Cepstral Coefficients) are computed, where DCT (Discrete Cosine Transformation) is applied to the mel-scale filter bank output. In this paper, we propose robust feature extraction based on kernel PCA instead of DCT. Its effectiveness is confirmed by word recognition experiments on reverberant speech. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 47, 号 6, p. 1767-1773, 発行日 2006-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |