WEKO3
アイテム
頑健なパラメタ推定のためのクロスバリデーション EM 法の提案
https://ipsj.ixsq.nii.ac.jp/records/56862
https://ipsj.ixsq.nii.ac.jp/records/568629a1c307b-1b62-45fa-be57-82c1a342e19b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-12-22 | |||||||
タイトル | ||||||||
タイトル | 頑健なパラメタ推定のためのクロスバリデーション EM 法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Cross-validation EM Algorithm for Robust Parameter Estimation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学学術情報メディアセンター(南館) | ||||||||
著者所属 | ||||||||
DepartmentofElectricalEngineering UniversityofWashington | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Academic Center for Computing and Media Studies [South Building], Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Electrical Engineering, University of Washington | ||||||||
著者名 |
篠崎, 隆宏
× 篠崎, 隆宏
|
|||||||
著者名(英) |
Takahiro, SHINOZAKI
× Takahiro, SHINOZAKI
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | EM アルゴリズムの欠点である過学習の問題を補うため、従来の自己尤度に代えてクロスバリデーション尤度を用いる新しい最尤学習アルゴリズムの提案を行う。並列化 EM学習と同様に学習セットを区画化し、各区画ごとに求めたモデルの十分統計量を用いることで、提案手法は従来の EM 学習と同程度の計算量で実行可能である。人工的なデータを用いた分析実験により、提案法が従来の EM アルゴリズムと比較して過学習に対して頑健であることを示す。中国語放送音声を用いた大語彙連続音声認識実験により、提案手法が EM 学習と比較してより多くのパラメタを有効に活用し、単語誤り率の削減に有効であることを示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A new maximum likelihood training algorithm is proposed that compensates for weaknesses of the EM algorithm by using cross-validation likelihood in the expectation step to avoid overtraining. By using a set of sufficient statistics associated with a partitioning of the training data, as in parallel EM, the algorithm has the same order of computational requirements as the original EM algorithm. Analyses using a GMM with artificial data show the proposed algorithm is more robust for overtraining than the conventional EM algorithm. Large vocabulary recognition experiments on Mandarin broadcast news data show that the method makes better use of more parameters and gives lower recognition error rates than EM training. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2006, 号 136(2006-SLP-064), p. 191-196, 発行日 2006-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |