WEKO3
アイテム
混合因子分析に基づく話者識別モデルのパラメータ共有構造
https://ipsj.ixsq.nii.ac.jp/records/57166
https://ipsj.ixsq.nii.ac.jp/records/57166a654fc65-ef5e-4744-b37d-1e16d8e80b87
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-12-18 | |||||||
タイトル | ||||||||
タイトル | 混合因子分析に基づく話者識別モデルのパラメータ共有構造 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Parameter Sharing of Mixtures of Factor Analyzers for Speaker Identification | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属 | ||||||||
名古屋工業大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Media Science, Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology | ||||||||
著者名 |
山本, 啓善
× 山本, 啓善
|
|||||||
著者名(英) |
H., Yamamoto
× H., Yamamoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,話者識別実験において混合因子分析モデルのパラメータ共有構造について検討を行う.また,識別性能を向上させるため,ML推定により得られたモデルに最小分類誤り学習を適用する.パラメータの共有方法には因子負荷行列を共有する方法や独自因子の分散を共有する方法などが考えられる.我々は,テキスト独立型話者識別実験より,全ての共有方法において対角共分散行列や全共分散行列を用いたGMMに対する有意性を確認した.学習データが少ない場合においても,ほぼ同様の傾向が見られた.また,本実験においては独自因子の分散を共有した場合が,最も有効であり,このとき,対角共分散行列を用いたGMMに対して識別誤りを約26%削減することができた.さらに,混合因子分析モデルに対し,最小分類誤り学習を適用することにより,約3%の識別誤り率の改善が見られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper investigates the parameter tying strategies of mixtures of factor analyzers (MFAs) and discriminative training of MFA based on Maximum Likelihood (ML) solution for speaker identification. The parameters of factor loading matrices or diagonal covariance matrices are shared in different mixture of MFA. The minimum classification error (MCE) training is applied to the MFA parameters to enhance the discrimination abilities. The results of text-independent speaker identification experiments show that the MFAs outperform the conventional Gaussian mixture models (GMMs) with diagonal or full covariance matrices. Also the same tendency are seen when training data is sparse. MFAs achieve the best performance when sharing the diagonal matrices, resulting in a relative error reduction of 26% over the GMM with diagonal covariance matrices. the recognition performance is further improved by the MCE training with an additional 3% error reduction. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2003, 号 124(2003-SLP-049), p. 91-96, 発行日 2003-12-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |