WEKO3
アイテム
音韻空間への射影に基づく話者正規化による音素認識
https://ipsj.ixsq.nii.ac.jp/records/57465
https://ipsj.ixsq.nii.ac.jp/records/57465d1f0554b-354e-4729-bb82-2e3eabc8557c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-12-21 | |||||||
タイトル | ||||||||
タイトル | 音韻空間への射影に基づく話者正規化による音素認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Phoneme Recognition by Speaker Normalization based on Projection to Phonetic Space | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者名 |
西田, 昌史
× 西田, 昌史
|
|||||||
著者名(英) |
Masafumi, Nishida
× Masafumi, Nishida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識の実用化において,不特定話者の音声を高精度に認識することが必要となってくる.しかし,話者の違いによる変動と音素コンテキストの変動により,認識精度が劣化してしまう.これに対して,音声データから音韻性と話者性を分離し,音韻性のみを抽出することができれば,頑健な話者正規化による音声認識が可能となる.また,話者性を抽出することで,話者性を考慮した頑健な話者適応による音声認識も可能になると考えられる.これまでに話者内分散の大きい空間を音韻空間,話者内分散の小さい空間を話者空間とみなし,話者空間へ射影することにより話者照合を行う方法を提案してきた.本研究では,音声データから話者空間への射影成分を取り除き,音韻空間への射影成分のみを用いて話者正規化を行う方法について検討を行った. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In practical speech recognition, it is required to recognize precisely the speech data spoken by many speakers. But it is a difficult problem, because of difference among speakers and phonetic contexts. To this problem, if phonetic information and speaker information included in speech data can be separated and only phonetic information is extracted, robust speaker normalization will be realized. If speaker information included in speech data can be extracted, robust speaker adaptation will be also realized. We have already proposed a speaker verification method by projection to speaker space, under The assumption that a space with large variation of within-speaker is a "phonetic space" and a space with small variation of within-speaker variance is a "speaker space". In this study, we studied a speaker normalization method by projection to phonetic space based on this insight. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 119(2000-SLP-034), p. 89-94, 発行日 2000-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |