Item type |
SIG Technical Reports(1) |
公開日 |
2018-12-03 |
タイトル |
|
|
タイトル |
i-vector/PLDAに基づく話者照合による非線形帯域拡張法の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
EVALUATION ON NON-LINEAR ARTIFICIAL BANDWIDTH EXTENSION USING I-VECTOR/PLDA SPEAKER VERIFICATION |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
学生ポスターセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
首都大学東京 |
著者所属 |
|
|
|
首都大学東京 |
著者所属 |
|
|
|
首都大学東京 |
著者名 |
上西, 遼大
塩田, さやか
貴家, 仁志
|
著者名(英) |
Ryota, Kaminishi
Sayaka, Shiota
Hitoshi, Kiya
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本論文は,i-vector / PLDA に基づく話者照合システムを用いて非線形帯域拡張 (N-Bwe) 法を評価することを目的としている.N-Bwe 法とは帯域拡張法の一つで,モデル学習を行わず,計算量が非常に軽い手法として提案された.N-Bwe は単純な非線形関数とフィルタのみで構成されているにもかかわらず,GMM-UBM に基づく話者照合の等価エラー率 (EER) と二乗平均平方根対数スペクトル歪み (RMS-LSD) において高い性能を得られることが報告されている.PLDA に基づく話者照合は話者とチャネルの依存性を分離することに焦点を当てているが,帯域制限による劣化音声を用いた場合については議論されていない.そこで本論文では,PLDA に基づく話者照合システムを構築し,N-Bwe や他の帯域拡張法を用いることでサンプリング周波数の違いによる帯域制限のかかった音声がシステムに与える影響について調査し,帯域拡張を適用した音声の客観評価と EER の関係を考察した.実験結果より,N-Bwe で生成された音声は低い RMS-LSD を得られ,かつアップサンプリングのみを行なった音声と比較して EER が 1.78 ポイント改善したことを報告する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper aims to evaluate an effect of a non-linear bandwidth extension (N-Bwe) method by using i-vector / PLDA-based automatic speaker verification (ASV) systems. The N-Bwe method has been reported as a blind, non-learning and light-weight BWE approach. Although the N-Bwe method consists of a simple non-linear function and filters, it has archived high accuracy in terms of speaker individuality and root mean square log-spectral distortion (RMS-LSD). Recently, i-vector/PLDA-based ASV systems become one of the state-of-the-art ASV systems. While the PLDA-based ASV approaches focus on removing speaker and channel dependency, there are few discussions about speeches which degraded by band limits. Thus, this paper investigates the influence of the speech degradation by band limits toward the PLDA-based ASV systems. In the experiments, the N-Bwe and shift-based BWE methods were evaluated by the PLDA-based ASV systems. From the results, the N-Bwe method improved 1.78 points of equal error rate (EER) from the simply up-sampled situation. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2018-SLP-125,
号 14,
p. 1-6,
発行日 2018-12-03
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |