ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2009
  4. 2009-SLP-079

順位統計量を用いた話者照合のためのコホート話者選択方法

https://ipsj.ixsq.nii.ac.jp/records/67058
https://ipsj.ixsq.nii.ac.jp/records/67058
8a982e0c-2c29-48fa-8d16-21a281588583
名前 / ファイル ライセンス アクション
IPSJ-SLP09079027.pdf IPSJ-SLP09079027.pdf (586.8 kB)
Copyright (c) 2009 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2009-12-14
タイトル
タイトル 順位統計量を用いた話者照合のためのコホート話者選択方法
タイトル
言語 en
タイトル Using Cohort Speaker for Text-Independent Speaker Verification with Rank-Estimator
言語
言語 jpn
キーワード
主題Scheme Other
主題 【Session-10 一般(ポスターセッション)】
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
千葉大学大学院融合科学研究科
著者所属
徳島大学工学部
著者所属
千葉大学大学院融合科学研究科
著者所属
千葉大学大学院融合科学研究科
著者所属(英)
en
Chiba University
著者所属(英)
en
The University of Tokushima
著者所属(英)
en
Chiba University
著者所属(英)
en
Chiba University
著者名 岡本, 悠 柘植, 覚 堀内, 靖雄 黒岩, 眞吾

× 岡本, 悠 柘植, 覚 堀内, 靖雄 黒岩, 眞吾

岡本, 悠
柘植, 覚
堀内, 靖雄
黒岩, 眞吾

Search repository
著者名(英) Haruka, Okamoto Satoru, Tshge Yasuo, Horiuchi Shingo, Kuroiwa

× Haruka, Okamoto Satoru, Tshge Yasuo, Horiuchi Shingo, Kuroiwa

en Haruka, Okamoto
Satoru, Tshge
Yasuo, Horiuchi
Shingo, Kuroiwa

Search repository
論文抄録
内容記述タイプ Other
内容記述 本論文では,順位統計量を用いた話者照合手法を紹介する.さらに,順位統計量を用いた話者照合手法における照合コストを下げるためのコホート話者の選択方法について提案する.コホート話者は申告者の音声に対してシステムに登録された不特定多数の話者モデル (GMM) との尤度の順位を基準に作成する.評価実験として,科学警察研究所が構築した大規模話者骨導音声データベースに収録されている男性 283 名の気導音声を用いて実験を行った.従来手法では,全話者 283 名による順位統計量で算出した minDCF が 0.0092 に対して,提案手法では平均 57 名の順位統計量で 0.0098,101 名の順位統計量で 0.0094 という同等の性能を達成した.また,照合スコアとして T-norm を用いた場合の minDCF が 0.0154 だった.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we introduce a novel speaker verification method which determines whether a claimer is accepted or rejected by the rank of the claimer in a large number of speaker models instead of score normalization, such as T-norm and Z-norm. The method has advantages over the standard T-norm in speaker verification accuracy. However, it needs much computation time as well as T-norm that needs calculating likelihoods for many cohort models. Hence, we also discuss the speed-up the method that selects cohort speakers for each target speaker in the training stage. This data driven approach can significantly reduce computation time resulting in faster speaker verification decision. We conducted text-independent speaker verification experiments using large-scale Japanese speaker recognition evaluation corpus constructed by National Research Institute of Police Science. From the corpus, we used utterances collected from 283 Japanese males. As results, the proposed method whose the number of cohort speaker is 57 achieved an minDCF of 0.0098, while using 282 speakers as cohort speaker obtained 0.0092 and T-norm obtained 0.0154.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 音声言語情報処理(SLP)

巻 2009-SLP-79, 号 27, p. 1-6, 発行日 2009-12-14
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 00:44:55.528555
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3