WEKO3
アイテム
雑音下音声認識の性能推定のためのひずみ尺度の検討
https://ipsj.ixsq.nii.ac.jp/records/56757
https://ipsj.ixsq.nii.ac.jp/records/56757cd5b4278-9206-4e0c-87d2-85f2c1dfea57
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-12-20 | |||||||
タイトル | ||||||||
タイトル | 雑音下音声認識の性能推定のためのひずみ尺度の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Distortion measure used for performance estimation of speech recognition system under noise conditions | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者名 |
橋本, 倫和
× 橋本, 倫和
|
|||||||
著者名(英) |
Tomokazu, HASHIMOTO
× Tomokazu, HASHIMOTO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまでに我々は,ひずみ尺度として ITU-T 勧告 P.862 の PESQ を用いて認識性能を推定する手法を開発した.本手法により高い精度で認識性能を推定できるものの,それは個々の雑音抑圧アルゴリズムに最適化した推定式を用意する場合に限られていた.しかし,実用上は一つの推定式で様々な雑音抑圧アルゴリズムに適用できることが望まれる.この問題は,ひずみの大きさと認識性能の関係が雑音抑圧アルゴリズムによって異なることに起因するので,本稿ではひずみ尺度を修正することによりその解決を図った.認識性能の推定実験を行った結果,修正したひずみ尺度の有効性が明らかとなった.また,大量の実音声データの代わりに用いるために開発したタスク依存擬似音声は,修正したひずみ尺度においても有効であることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, we have developed a method for estimating the recognition performance using the PESQ that is the distortion measure standardized by the ITU-T as Rec. P.862. This method can give an accurate estimate only when the estimator optimized for the noise reduction algorithm used is available. However, practically the single estimator that can be used for various noise reduction algorithms is required. This problem is caused by an inconsistency between the distortion value and the recognition performance. This paper describes the effectiveness of the modified PESQ developed to solve this problem. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2007, 号 129(2007-SLP-069), p. 19-24, 発行日 2007-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |