Item type |
SIG Technical Reports(1) |
公開日 |
2017-02-10 |
タイトル |
|
|
タイトル |
非線形帯域拡張法に基づく話者照合の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Non-linear artificial bandwidth extension of narrowband speech for speaker verification |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
話者検出・単語検出 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
首都大学東京大学院システムデザイン研究科 |
著者所属 |
|
|
|
首都大学東京大学院システムデザイン研究科 |
著者所属 |
|
|
|
首都大学東京大学院システムデザイン研究科 |
著者所属(英) |
|
|
|
en |
|
|
Department of Information and Communication Systems Engineering, Tokyo Metropolitan University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information and Communication Systems Engineering, Tokyo Metropolitan University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information and Communication Systems Engineering, Tokyo Metropolitan University |
著者名 |
中西, 亮介
塩田, さやか
貴家, 仁志
|
著者名(英) |
Ryôsuke, Nakanishi
Sayaka, Shiota
Hitoshi, Kiya
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
声を用いた生体認証技術である話者照合は実用化が進みつつある.今後のさらなる展開として携帯電話などの電話音声を用いたセキュリティシステムとしての利用が期待されている.しかしながら電話での通話音声は通信速度の確保のため帯域制限がかかっていることが多い.帯域制限のかかった音声は明瞭性に欠け,音質や話者性が大きく低下することが知られている.本研究では非線形帯域拡張法を電話音声などの帯域制限のかかった音声に適用し,話者照合における帯域拡張の有効性を評価する.帯域拡張法は狭帯域音声から広帯域音声を作る技術としてこれまでいくつか提案されている.しかし,これまで話者照合への適用例はほとんど報告されていない.提案法は狭帯域音声に非線形関数を用いることで広帯域音声を生成し,狭帯域音声と加算合成するため非常に処理が軽いという特徴を持つ.提案法の性能評価は話者照合の精度で評価するために話者照合実験により行われた.その結果,学習データとテストデータそれぞれに提案法を適用し 8kHz から 16kHz に帯域拡張した場合に帯域拡張を行う前に比べエラー改善率が 27.7% 改善した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Speaker verification is expected to be in practical use as a biometric authentication system using speech. Speaker verification systems are particularly expected to be performed on telephone networks. It is well known that the bandwidth limitation speeches lack clarity and drastically degrade the speech quality and the speaker individuality. This paper proposes a non-linear bandwidth extension method for adapting it to the narrowband speeches, and evaluates it for a speaker verification system. Several artificial bandwidth expansion methods have been proposed to generate a wideband signal from a narrowband signal. However, most the conventional expansion methods have not been applied to speaker verification systems. In the proposed method, a wideband speech is generated from a narrowband one by using a non-linear bandwidth expansion method, so that a light-weight bandwidth extension is given. The proposed method is evaluated under some speaker verification experiments to confirm the performance of the speaker verification. As a result, the proposed method has an Error Reduction of 27.7% compared to the use of narrowband speeches, where the bandwidth of the training data and the test data are respectively expanded from 8kHz to 16kHz. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2017-SLP-115,
号 4,
p. 1-6,
発行日 2017-02-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |