WEKO3
アイテム
不特定話者混合分布HMMにおける Tree - Basedクラスタリングの検討
https://ipsj.ixsq.nii.ac.jp/records/57552
https://ipsj.ixsq.nii.ac.jp/records/575522a94443d-351e-449b-af1d-4f52582a63c4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-12-20 | |||||||
タイトル | ||||||||
タイトル | 不特定話者混合分布HMMにおける Tree - Basedクラスタリングの検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on Tree - Based Clustering for Speaker - Independent Gaussian Mixture HMMs | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
KDD研究所 | ||||||||
著者所属 | ||||||||
KDD研究所 | ||||||||
著者所属 | ||||||||
KDD研究所 | ||||||||
著者所属 | ||||||||
KDD研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDD R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDD R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDD R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDD R&D Laboratories Inc. | ||||||||
著者名 |
加藤, 恒夫
× 加藤, 恒夫
|
|||||||
著者名(英) |
Tsuneo, Kato
× Tsuneo, Kato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Tree-basedクラスタリングは,音素コンテキストを分割条件としてトライフォンの集合に対してクラスタリングを行いHMM状態の共有化を図る有効な手法である.従来の報告では,計算量の点から対象が単一分布HMMに限られていた.しかし,単一分布HMMでは不特定話者の音響的特徴を表現するのに不十分であるため,必ずしも適切なトポロジ(HMM状態の共有関係)が得られていないと考えられる.また所望の混合分布トライフォンを得るためには,tree-basedクラスタリングの後,混合数を倍増する操作と学習を繰り返すため膨大な時間を要する.そこで,本稿では混合分布トライフォンに対して分布のクラスタリングを行いながらtree-basedクラスタリングを行う手法を提案する.本手法により学習時間が1/3程度に短縮され,認識実験では1∼2%の音素正解精度の改善を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Tree-based clustering is an effective method to share HMM states by clustering triphones based on phonetic questions. Previous researches on this method have been made on HMMs of single Gaussian output distributions due to computational restrictions. However, single Gaussian HMMs may not be sufficient to create appropriate topology (i. e. HMM state sharing). Furthermore, a significant amount of time is required to obtain Gaussian mixture HMMs for repetitive distribution splitting and embedded training. In this paper, we propose a tree-based clustering for Gaussian mixture HMMs based on distribution clustering. This method achieved 67% reduction on training time and 1-2% improvement in phoneme accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 108(1999-SLP-029), p. 37-42, 発行日 1999-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |