WEKO3
アイテム
Hidden Conditional Neural Fieldsを用いた音声認識における目的関数と階層的音素事後確率特徴量の検討
https://ipsj.ixsq.nii.ac.jp/records/72659
https://ipsj.ixsq.nii.ac.jp/records/72659d6b512b6-a0c6-4651-9470-ffbe754e043b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-01-28 | |||||||
タイトル | ||||||||
タイトル | Hidden Conditional Neural Fieldsを用いた音声認識における目的関数と階層的音素事後確率特徴量の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Investigations of Objective Functions and Hierarchical Phoneme Posterior Feature for Hidden Conditional Neural Fields based Automatic Speech Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声認識 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学情報・知能工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報・知能工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報・知能工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Toyohashi University of Technology | ||||||||
著者名 |
藤井, 康寿
× 藤井, 康寿
|
|||||||
著者名(英) |
Yasuhisa, Fujii
× Yasuhisa, Fujii
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々は,Hidden Conditional Neural Fields(HCNF) を用いた音声認識手法について検討を進めている.本稿では,HCNFを学習するための目的関数として,正解状態系列が一意に定まらない場合においても正解状態系列に対するエラー数を考慮した学習が可能となるHidden Boosted MMI(HB-MMI) を提案する.HB-MMIを用いることで,過学習が起こりにくい状況では認識率を改善できることがわかった.本稿では,HCNFが出力する音素事後確率を次段のHCNFの特徴量とする階層的音素事後確率特徴量を用いた音声認識手法についても述べる.階層的音素事後確率特徴量を単独で用いる場合でも認識率の改善を得ることができたが,HB-MMI学習を組み合わせることで,さらなる改善を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have investigated automatic speech recognition using Hidden Conditional Neural Fields(HCNF). In this paper, we propose a new objective function, Hidden Boosted MMI(HB-MMI), which can consider the number of errors in training data even if the correct state sequence is not known for training HCNF. The experimental results show that HB-MMI can improve recognition accuracy when overfitting does not occur. In this paper, we also present an automatic speech recognition method using hierarchical phoneme posterior feature where the output of the first HCNF is used for the input of the second HCNF. The experimental results show that the feature can improve the recognition accuracy. By using both of the proposed methods, we obtained further improvement. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告 音声言語情報処理(SLP) 巻 2011-SLP-85, 号 13, p. 1-6, 発行日 2011-01-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |