Item type |
Journal(1) |
公開日 |
2017-01-15 |
タイトル |
|
|
タイトル |
正則化処理を用いた特徴空間識別学習の高精度化と音響環境適応 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Improving Feature-space Discriminative Training and Adaptation Using Regularization Process |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 大語彙連続音声認識,識別学習,正則化,適応,書き起こしデータ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社 |
著者所属(英) |
|
|
|
en |
|
|
IBM Research |
著者所属(英) |
|
|
|
en |
|
|
IBM Research |
著者所属(英) |
|
|
|
en |
|
|
IBM Research |
著者名 |
福田, 隆
市川, 治
立花, 隆輝
|
著者名(英) |
Takashi, Fukuda
Osamu, Ichikawa
Ryuki, Tachibana
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
GMM/HMMシステムにおいては,音響モデルを新たな音響環境に適応するため,MAP法などのモデル空間適応がさかんに利用されている.一方で,近年の音声認識システムは特徴空間上の識別学習を行っているものの,識別的特徴変換行列が環境適応の対象になることは少ない.しかし,識別的特徴変換行列は大規模データから統計的に学習されるため,音響モデルと並んで識別的変換行列も対象ドメインに適応することが望ましい.本論文では,はじめに,特徴空間上の識別的適応において,小規模な適応データで良好に動作する方法を提案する.提案法では,適応学習時の間接的微分演算に正則化項を導入するとともに,音響モデルの更新にMAP基準を用いる.そして,実証実験において提案法はモデル空間適応のMAP法と比較して4.4%の相対的改善を達成したことを示す.次に,本論文では通常の特徴空間識別学習の前後に事前・事後学習を導入することによって,少量の書き起こしデータのみが利用可能な状況において,音響モデルを高精度化する方法を提案する.提案法は大規模データを用いた検証実験において,平均して相対的に1.5%以上の改善が得られたことを示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In GMM/HMM systems, model-space adaptation techniques such as MAP are often used for porting old acoustic models into new domains. Although modern ASR systems leverage feature-space discriminative training, adapting feature space transforms has not been much investigated. However, because the feature space transforms are statistically estimated with a large corpus, the transforms should also be adapted. This paper improves the feature-space discriminative adaptation by introducing a regularization term for an indirect differential computation of the fMPE objective function, and also by updating the acoustic models with MAP instead of ML criterion during the fMPE adaptation. The proposed method performed favorably for the adaptation conditions with small amounts of adaptation data, and yielded 4.4% relative improvement in comparison with MAP-adapted system without using the fMPE adaptation. Next, we introduce the regularization process to a standard feature-space discriminative training for situations when only limited amount of training data is available. The proposed method consists of pre- and post-training steps, and yielded more than 1.5% relative for various system configurations. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 58,
号 1,
p. 288-296,
発行日 2017-01-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |