WEKO3
アイテム
効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化
https://ipsj.ixsq.nii.ac.jp/records/56731
https://ipsj.ixsq.nii.ac.jp/records/56731d033e75d-5043-45c2-84ff-0f6c2c7781f5
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2007-07-21 | |||||||
| タイトル | ||||||||
| タイトル | 効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Gaussian Mixture Optimization based on Efficient Cross-validation | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies Kyoto University | ||||||||
| 著者名 |
篠崎, 隆宏
河原, 達也
× 篠崎, 隆宏 河原, 達也
|
|||||||
| 著者名(英) |
Takahiro, SHINOZAKI
Tatsuya, KAWAHARA
× Takahiro, SHINOZAKI Tatsuya, KAWAHARA
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 従来の自己尤度に代えてクロスバリデーション尤度を用いる新しい混合分布最適化アルゴリズムの提案を行い、HMMを用いた音声認識への応用を行う。混合分布の最適化の目的は、過剰な要素を削減することでモデルの一般性を高めることであり、最適化は混合分布要素の対を尤度に従い順次選択・併合することで行う。クロスバリデーション尤度はモデルパラメタのオーバーフィッティングを避ける上で従来の尤度よりも有効であり、また十分統計量を活用することで高速に評価することができる。これにより、従来よりも優れた分布要素対選択を行うことができるとともに、経験的な閾値に頼らない併合停止基準が与えられる利点がある。日本語話し言葉コーパスを用いた大語彙連続音声認識をタスクとし、HMMの学習に対して本手法を適用した実験結果において、本手法が従来手法よりも高い認識率を与えることを示す。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | A Gaussian mixture optimization method is explored using cross-validation likelihood as an objective function instead of the conventional training set likelihood.The optimization is based on reducing the number of mixture components by selecting and merging a pair of Gaussians step by step based on the objective function so as to remove redundant components and improve the generality of the model. Cross-validation likelihood is more appropriate for avoiding over-fitting than the conventional likelihood and can be efficiently computed using sufficient statistics. It results in a better Gaussian pair selection and provides a termination criterion that does not rely on empirical thresholds. Large-vocabulary speech recognition experiments on oral presentations show that the cross-validation method gives a smaller word error rate with an automatically determined model size than a baseline using the conventional training procedure. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2007, 号 75(2007-SLP-067), p. 81-86, 発行日 2007-07-21 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||