WEKO3
アイテム
変分ベイズ法を用いたGMMに基づく話者認識
https://ipsj.ixsq.nii.ac.jp/records/56607
https://ipsj.ixsq.nii.ac.jp/records/566075ba0d362-00ce-45af-a189-a0997ee1e500
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-12-02 | |||||||
タイトル | ||||||||
タイトル | 変分ベイズ法を用いたGMMに基づく話者認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method | |||||||
言語 | ||||||||
言語 | eng | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋工業大学工学研究科創成シミュレーション工学専攻 | ||||||||
著者所属 | ||||||||
名古屋工業大学工学研究科創成シミュレーション工学専攻 | ||||||||
著者所属 | ||||||||
名古屋工業大学工学研究科創成シミュレーション工学専攻 | ||||||||
著者所属 | ||||||||
名古屋工業大学工学研究科創成シミュレーション工学専攻 | ||||||||
著者所属 | ||||||||
名古屋工業大学工学研究科創成シミュレーション工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Nagoya Institute of Technology | ||||||||
著者名 |
伊藤, 達也
× 伊藤, 達也
|
|||||||
著者名(英) |
Tatsuya, Ito
× Tatsuya, Ito
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ガウス混合モデル (Gaussian Mixture Model ; GMM) に基づく話者認識は,これまで尤度最大化 (Maximum Likelihood ; ML) 基準や事後確率最大化 (Maximum a Posterior ; MAP) 基準が用いられてきたしかし, ML 基準は,モデルパラメータを確定的変数として点推定するため,学習データが十分に得られない場合,モデルの推定精度が低化する可能性がある.この問題に対し,近年,変分ベイズ法が提案され,様々なモデルにベイズ学習が適用可能となった.本研究では, GMM の学習に変分ベイズ法を適用し,ベイズ基準による話者認識の有効性について検討する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a speaker identification system based on Gaussian Mixture Models (GMM) using the variational Bayesian method. Maximum Likelihood (ML) and Maximum A Posterior (MAP) are well-known methods for estimating GMM parameters. However, the overtraining problem occurs with insufficient data due to a point estimate of model parameters. The Bayesian approach estimates a posterior distribution of model parameters and achieves a robust prediction. To solve complicated integral calculations in the Bayesian approach, the variational Bayesian method has been proposed. This paper investigates the performance of the Bayesian approach in large speaker identification tasks. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 123(2008-SLP-074), p. 185-190, 発行日 2008-12-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |