WEKO3
アイテム
認識対象語彙数を考慮した雑音下孤立単語認識の性能推定
https://ipsj.ixsq.nii.ac.jp/records/56645
https://ipsj.ixsq.nii.ac.jp/records/5664529e10817-331c-47a5-b622-0f9af30e4932
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-07-11 | |||||||
タイトル | ||||||||
タイトル | 認識対象語彙数を考慮した雑音下孤立単語認識の性能推定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance Estimation of Noisy Isolated Word Recognition Considering the Number of Vocabulary Words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者名 |
中島, 智弘
× 中島, 智弘
|
|||||||
著者名(英) |
Tomohiro, Nakajima
× Tomohiro, Nakajima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまでに我々は,ITU-T 勧告 P.862 の PESQ を用いて認識性能を推定する手法を開発した.本手法により,雑音や雑音抑圧アルゴリズムの種類によらず高い精度で認識性能を推定できるものの,それは認識タスク毎に最適化した推定式を用意する場合に限られていた.一般に,雑音環境や前処理が同じでも,認識タスク,すなわち認識対象語彙数や文法的複雑さによって認識性能は変動する.このことは,認識タスクが変わった場合には,それに最適化した推定式をあらためて求める必要があることを意味する.しかし,実用上は一つの推定式で様々な認識タスクに適用できることが望まれる.この問題を解決する方法としては,認識タスクの難しさを表すパラメータを推定式に導入することが考えられる.本稿では,まず認識対象語彙数をパラメータに持つ推定式を提案する.様々な語彙数の孤立単語認識の性能を推定した結果,提案法により高い精度で単語認識率を推定できることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is essential to ensure QoS (Quality of Service) when offering a speech recognition service for use in noisy environments. This means that the recognition performance in the target noise environment must be investigated. Previously, we proposed a method for estimating the recognition performance from a distortion value, which represents the difference between the noisy speech in the target noise environment and its original clean version. However, there is the problem that when the recognition task is changed, an additional recognition experiment must be performed in order to obtain the estimator corresponding to it. To reduce this cost, we propose a new method considering the number of vocabulary words. Experimental results confirmed that the proposed method can give an accurate estimate for isolated word recognition with the arbitrary number of vocabulary words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 68(2008-SLP-072), p. 63-68, 発行日 2008-07-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |