WEKO3
アイテム
音声認識における高精度な動的特徴量計算法の提案
https://ipsj.ixsq.nii.ac.jp/records/57368
https://ipsj.ixsq.nii.ac.jp/records/57368b45f98aa-6854-4557-99b0-88b94cfa2392
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-12-20 | |||||||
タイトル | ||||||||
タイトル | 音声認識における高精度な動的特徴量計算法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A method for improving the accuracy of dynamic features calculation in speech recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science & Technical Research Labs. | ||||||||
著者名 |
小早川健
× 小早川健
|
|||||||
著者名(英) |
Takeshi, S.Kobayakawa
× Takeshi, S.Kobayakawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では音声認識における新たな動的特徴量の計算法を提案する。提案法では,1)動的特徴量の推定に用いる静的特徴量の時間分解能を上げ,2)動的特徴量の推定時間をフレーム感覚の整数倍に拘束されることなく任意に設定可能とした。提案法をニュース番組で発声される音声の認識実験によって評価したところ,特徴量を推定する時間を適切に選べば,認識率の改善が見られることが分かった。単語正解精度でみた誤認識改善率は,雑音を含むニュース文の評価セットで24%と効果が大きかった。全体での誤認識改善率は6.5%であった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A new method for estimating dynamic features used in speech recognition is proposed. The proposed method involves: 1) increasing time resolution of static features used for dynamic feature estimation, 2) relaxing the restriction that estimation span must be an integer multiple of frame shift, and making the estimation span arbitrary. Evaluating the proposed method with a broadcast news testset, word accuracy improved by selecting appropriate estimation span. Error reduction rate in word accuracy was up to 24% relatively in noisy news speech. The overall error reduction rate was 6.5% relatively. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2001, 号 123(2001-SLP-039), p. 1-6, 発行日 2001-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |