WEKO3
アイテム
フレーム間相関を用いた音韻HMM
https://ipsj.ixsq.nii.ac.jp/records/37568
https://ipsj.ixsq.nii.ac.jp/records/3756828106844-c077-4a9b-b0b8-8b08d0be8fa1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1992 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1992-09-10 | |||||||
タイトル | ||||||||
タイトル | フレーム間相関を用いた音韻HMM | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | PHONEME HMMS USING FRAME CORRELATIONS | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者名 |
高橋, 敏
× 高橋, 敏
|
|||||||
著者名(英) |
Satoshi, Takahashi
× Satoshi, Takahashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在のHMMの問題点の1つに、特徴ベクトル間の遷移に制約がない点が挙げられる。互いに出力確率が高い特徴ベクトル間の遷移は、学習データ中で観測されなかった遷移でも高い出力確率が与えられている。本稿では、2フレーム間の相関を用いて特徴ベクトルの遷移を制約し、不特定話者用HMMの特徴量分布を、入力話者に適した範囲に制約する新しいHMMを提案する。このモデルは、異なる音韻間の音韻特徴量分布の重なりを減少させ、認識率を向上させることができる。我々は既に、離散型不特定話者用HMMをもとに、VQコードのBigramを用いて遷移を制約する離散型Bigram制約HMMを提案し、従来のHMMよりも性能がよいことを示した。本稿では、更に高い認識性能を得るために、この手法を半連続型HMM、連続型HMMに拡張した。これら3つのタイプのHMMを定式化し、連続音声中の音韻認識によって評価した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | One of the problems in Hidden Markov Modeling (HMM) is that there are no constraints on the feature vector transitions. All feature vector transitions which have high probabilities are allowed even if such transitions are not observed in the training data. This paper proposes new HMMs that use correlations between two frames to constrain the feature distributions of speaker-independent HMM to the region that is appropriate for an input speaker. This makes it possible to reduce the overlapping of feature distributions between different phonemes, and improve recognition performance. We previously proposed the bigram-constrained HMM based on the combination of the discrete HMM and the VQ-code bigram, and showed that it performed better than a conventional HMM. In this paper, the strategy is extended to semi-continuous HMMs and continuous HMMs to obtain better recognition performance. These three new types of HMMs are formulated and evaluated by phoneme recognition in continuous speech. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 1992, 号 69(1992-HI-044), p. 1-8, 発行日 1992-09-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |