WEKO3
アイテム
大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験
https://ipsj.ixsq.nii.ac.jp/records/56785
https://ipsj.ixsq.nii.ac.jp/records/5678558fe6c59-83f7-4ab7-8da8-ff8368cccb63
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-12-20 | |||||||
タイトル | ||||||||
タイトル | 大規模話者骨導音声データベースを用いたテキスト独立型話者照合実験 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text-independent speaker verification experiment using a large-scale bone-conducted speech database | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
徳島大学大学院 | ||||||||
著者所属 | ||||||||
千葉大学大学院 | ||||||||
著者所属 | ||||||||
徳島大学大学院 | ||||||||
著者所属 | ||||||||
科学警察研究所 | ||||||||
著者所属 | ||||||||
科学警察研究所 | ||||||||
著者所属 | ||||||||
科学警察研究所 | ||||||||
著者所属 | ||||||||
科学警察研究所 | ||||||||
著者所属 | ||||||||
徳島大学大学院 | ||||||||
著者所属 | ||||||||
徳島大学大学院 | ||||||||
著者所属 | ||||||||
徳島大学大学院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Research Institute of Police Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Research Institute of Police Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Research Institute of Police Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Research Institute of Police Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Tokushima | ||||||||
著者名 |
喜多, 雅彦
× 喜多, 雅彦
|
|||||||
著者名(英) |
Masahiko, KITA
× Masahiko, KITA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,科学警察研究所によって構築された大規模話者骨導音声データベースを用いた話者照合実験を行った結果を報告する.実験には,664名(男性 336名,女性 328名)のコンデンサマイクで収録された音声(気導音),骨導マイクで収録された音声(骨導音)を用いた.実験では,以前我々が提案した複数話者モデルの順位情報を用いた話者照合手法を評価した.また,話者モデルとして GMM とベクトル量子化 (VQ) セントロイドの比較,発声時期の違いによる照合精度の比較を行った.実験結果より,提案手法は従来の T-Norm を用いた話者照合手法より高い照合精度を示すことが観測された.さらに,話者モデルの違いによる照合精度の比較結果より,気導音では VQ セントロイドを用いた方が照合精度が高く,骨導音では GMM を用いた方が高いことが観測された.また,骨導音による照合精度は気導音より低く,さらに骨導音は時期差が生じた場合,照合精度低下が著しいことが観測された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we conducted a speaker verification experiment using large-scale speech database maintained by National Research Institute of Police Science, Japan. In this exepriment, we used speech data of 664 people collected by a capacitor microphone and a bone-conducted microphone. From experimental results, we confirmed that our proposed method that uses rank information obtained by multiple speaker model in previous work improved verification performance than a conventional method using T-norm score. In addition, we compared the speaker model based on GMMs and that based on VQ centroids. From this comparison, we can see that the speaker model based on VQ centroids is higher performance than that based on GMMs under the condition of the capacitor microphone speech. However, VQ centroids degraded the performance of that based on GMMs under the condition of the bone-conducted speech. Moreover, the performances of the bone-conducted speech significant degraded performance if there were difference of the speaking session between the registration and the testing. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2007, 号 129(2007-SLP-069), p. 183-188, 発行日 2007-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |