WEKO3
アイテム
DAEMアルゴリズムの話者・音声認識における有効性の検討
https://ipsj.ixsq.nii.ac.jp/records/57151
https://ipsj.ixsq.nii.ac.jp/records/57151827f8584-b1f2-4371-814d-6802a67f45a4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-12-18 | |||||||
タイトル | ||||||||
タイトル | DAEMアルゴリズムの話者・音声認識における有効性の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Deterministic Annealing EM algorithm for speaker and speech recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Enginnering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Enginnering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Enginnering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Media Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Enginnering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Enginnering, Nagoya Institute of Technology | ||||||||
著者名 |
板谷, 洋平
全, 炳河
南角吉彦
宮島, 千代美
徳田, 恵一
北村, 正
× 板谷, 洋平 全, 炳河 南角吉彦 宮島, 千代美 徳田, 恵一 北村, 正
|
|||||||
著者名(英) |
Y., Itaya
H., Zen
Y., Nankaku
C., Miyajima
K., Tokuda
T., Kitamura
× Y., Itaya H., Zen Y., Nankaku C., Miyajima K., Tokuda T., Kitamura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | GMM(Gaussian Mixture Model)やHMM(Hidden Markov Moldel)のパラメータ推定には,広くEM(Expectation Maximization)アルゴリズムが用いられる.しかし,EMアルゴリズムは,推定結果が初期値設定に依存してしまうという,局所最適性の問題を有する.この問題に対処するためにDAEM(Deterministic Annealing Expectation Maximization)アルゴリズムが提案された.本稿では,このDAEMアルゴリズムをGMM,及び音素境界情報が得られない場合のHMMのパラメータ推定(フラットスタート)にそれぞれ適用し,GMMを用いた話者認識,及びHMMを用いた連続音声認識における有効性に関する検討を行う. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper investigates the effectiveness of a DAEM (Deterministic Annealing Expectation Maximization) algorithm for speaker and speech recognition. The EM (Expectation Maximization) algorithm is widely used for paramete estimation of statistical models. However, the EM algorithm has the problem of initialization dependence. To relax this problem, the DAEM algorithm has been proposed. In this paper, we apply the DAEM algorithm to estimate acoustic models for speaker recognition and continuous speech recognition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 124(2003-SLP-049), p. 1-6, 発行日 2003-12-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |