WEKO3
アイテム
KL情報量によるAnchor modelの階層的クラスタリングに基づく話者認識
https://ipsj.ixsq.nii.ac.jp/records/69912
https://ipsj.ixsq.nii.ac.jp/records/699123dbafaf2-9f26-49b4-8b51-68b332dc2b49
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-07-15 | |||||||
タイトル | ||||||||
タイトル | KL情報量によるAnchor modelの階層的クラスタリングに基づく話者認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speaker Recognition Based on Agglomerative Clustering Using KL Divergence for Anchor Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音響モデル | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
同志社大学 | ||||||||
著者所属 | ||||||||
同志社大学 | ||||||||
著者所属 | ||||||||
同志社大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Doshisha University | ||||||||
著者名 |
細川, 光政
× 細川, 光政
|
|||||||
著者名(英) |
Mitsumasa, Hosokawa
× Mitsumasa, Hosokawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 従来のアンカーモデルではアンカーモデルを無作為に選択しており,多数のモデルを必要としていた.それに対して,本研究ではアンカーモデルを最適化するために,GMM 間の KL 距離に基づいてアンカーモデルを階層的にクラスタリングする手法を提案した.本手法により,無作為に選択されたアンカーモデルに対して音響的に類似した話者をクラスタリングすることで,効率的な認識を実現することができる.本手法の有効性を示すために,従来よく用いられている BIC に基づく話者クラスタリング手法との話者認識実験を行った結果,提案手法は従来手法に比べて認識精度の改善が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In conventional methods, it was needed many models and selected Anchor models at random. We proposed a speaker recognition method based on agglomerative clustering using KL divergence for Anchor model. The proposed method can recognize efficiently by clustering similar speakers acoustically for Anchor models. We conducted speaker recognition experiments using clustering methods based on BIC and proposed method. As a result, the proposed method can improve the recognition accuracy compared with the conventional BIC method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2010-SLP-82, 号 14, p. 1-6, 発行日 2010-07-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |