WEKO3
アイテム
音素ペアモデルによる音素間情報の表現に関する検討
https://ipsj.ixsq.nii.ac.jp/records/57505
https://ipsj.ixsq.nii.ac.jp/records/5750552ae66b0-7070-4122-a839-7bb01960833e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-07-14 | |||||||
タイトル | ||||||||
タイトル | 音素ペアモデルによる音素間情報の表現に関する検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Representation of Phone Correlation by Phone Pair Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院・工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院・新領域創成科学研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院・工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Engineering, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Frontier Sciences, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Engineering, University of Tokyo | ||||||||
著者名 |
李, 宝潔
× 李, 宝潔
|
|||||||
著者名(英) |
Baojie, Li
× Baojie, Li
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ある音素の特徴は発話毎に変動し、もし話者が異なればその分散は大きな値を示す。このような事実にもかかわらず、人間が良好に音声を認識できるのは、音素間の特徴が比較的安定していて、これを有効に使っているからと考えられる。そこで、このような音素間の関係を音素ペアモデルで表す。音素ペアモデルは2つの音素間の関係を音響ベクトルの結合確率として表現するものである。音素ペアモデルを音素HMMによる音声認識システムに統合して認識実験を行い、音素ペアモデルの尤度を付加する割合などに検討の余地があるものの、顕著な認識率の向上が得られた。さらに、頑健な音声認識にも有効であることが示された。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In view of human's ability of accurately recognizing speech in spite of large distributions of phone features, information on the relationship between phones should play an important role in speech recognition. The phone relationship can be modeled by our proposed Phone Pair Model(PPM). PPM statistically models the relationship between two phones using joint probability of acoustic features. After integrating PPM into HMM-based recognition systems, recognition experiments are conducted. The results showed remarkable increases in recognition rates only by a short phrase for adaptation. The Phone Pair Modeling was also shown valid for robust speech recognition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 64(2000-SLP-032), p. 7-12, 発行日 2000-07-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |