WEKO3
アイテム
順位統計量を用いた話者照合のためのコホート話者選択方法
https://ipsj.ixsq.nii.ac.jp/records/67058
https://ipsj.ixsq.nii.ac.jp/records/670588a982e0c-2c29-48fa-8d16-21a281588583
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-12-14 | |||||||
タイトル | ||||||||
タイトル | 順位統計量を用いた話者照合のためのコホート話者選択方法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Using Cohort Speaker for Text-Independent Speaker Verification with Rank-Estimator | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 【Session-10 一般(ポスターセッション)】 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
千葉大学大学院融合科学研究科 | ||||||||
著者所属 | ||||||||
徳島大学工学部 | ||||||||
著者所属 | ||||||||
千葉大学大学院融合科学研究科 | ||||||||
著者所属 | ||||||||
千葉大学大学院融合科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者名 |
岡本, 悠
柘植, 覚
堀内, 靖雄
黒岩, 眞吾
× 岡本, 悠 柘植, 覚 堀内, 靖雄 黒岩, 眞吾
|
|||||||
著者名(英) |
Haruka, Okamoto
Satoru, Tshge
Yasuo, Horiuchi
Shingo, Kuroiwa
× Haruka, Okamoto Satoru, Tshge Yasuo, Horiuchi Shingo, Kuroiwa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,順位統計量を用いた話者照合手法を紹介する.さらに,順位統計量を用いた話者照合手法における照合コストを下げるためのコホート話者の選択方法について提案する.コホート話者は申告者の音声に対してシステムに登録された不特定多数の話者モデル (GMM) との尤度の順位を基準に作成する.評価実験として,科学警察研究所が構築した大規模話者骨導音声データベースに収録されている男性 283 名の気導音声を用いて実験を行った.従来手法では,全話者 283 名による順位統計量で算出した minDCF が 0.0092 に対して,提案手法では平均 57 名の順位統計量で 0.0098,101 名の順位統計量で 0.0094 という同等の性能を達成した.また,照合スコアとして T-norm を用いた場合の minDCF が 0.0154 だった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we introduce a novel speaker verification method which determines whether a claimer is accepted or rejected by the rank of the claimer in a large number of speaker models instead of score normalization, such as T-norm and Z-norm. The method has advantages over the standard T-norm in speaker verification accuracy. However, it needs much computation time as well as T-norm that needs calculating likelihoods for many cohort models. Hence, we also discuss the speed-up the method that selects cohort speakers for each target speaker in the training stage. This data driven approach can significantly reduce computation time resulting in faster speaker verification decision. We conducted text-independent speaker verification experiments using large-scale Japanese speaker recognition evaluation corpus constructed by National Research Institute of Police Science. From the corpus, we used utterances collected from 283 Japanese males. As results, the proposed method whose the number of cohort speaker is 57 achieved an minDCF of 0.0098, while using 282 speakers as cohort speaker obtained 0.0092 and T-norm obtained 0.0154. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
音声言語情報処理(SLP) 巻 2009-SLP-79, 号 27, p. 1-6, 発行日 2009-12-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |