@techreport{oai:ipsj.ixsq.nii.ac.jp:00197813,
 author = {宮本, 春奈 and 塩田, さやか and 貴家, 仁志},
 issue = {28},
 month = {Jun},
 note = {本論文では,x-vector に基づく話者照合システムにおいて帯域拡張法を用いて生成した広帯域音声によるデータ拡張に着目する.x-vector に基づく話者照合システムにおけるデータ拡張には,様々なノイズを加えるだけでなく,狭帯域音声をアップサンプリングしたデータ,またアップサンプリングしたデータと帯域拡張データとを混ぜ合わせて学習に用いるものがこれまでに報告されており,さらに DNN による帯域拡張を用いたデータ拡張についても報告されている.一方近年,帯域拡張法の一つとして非線形帯域拡張法 (N-BWE) が提案されている.N-BWE はモデル学習を行わず,計算量が非常に軽い手法として提案された.N-BWE は単純な非線形関数とフィルタのみで構成されているにも関わらず,話者照合の等価エラー率 (EER) と二乗平均平方根対数スペクトル歪みそれぞれにおいて高い性能を得られることが報告されている.そこで本論文では,x-vector に基づく話者照合システムを構築する際に,N-BWE を適用した音声を拡張データとして使用して実験を行った.実験結果より,アップサンプリングした音声と N-BWE で帯域拡張した音声を拡張データとして加えて学習を行った結果,アップサンプリングした音声のみを拡張データとして用いたシステムと比較して EER のエラー改善率は 24.5% を達成した., This paper focuses on the performance of x-vector based automatic speaker verification (ASV) systems using bandwidth extension (BWE) methods for data augmentation. For the x-vector-based ASV system, data augmentation methods have been reported so far. These reports consider to use large amount of narrowband data. And, upsampling operation and BWE methods are applied to expand the training data. Additionally, deep neural network-based BWE method was used for data augmentation. On the other hand, non-linear bandwidth extension (N-BWE) method has been proposed as one of bandwidth extension methods. N-BWE was proposed as method with light-weight computational cost and non-learning. Although, N-BWE consists only of simple non-linear function and filters, it has been reported that the N-BWE method obtained low equal error rate and small values of root mean square-log spectral distance in some ASV systems. Comparing the performance of x-vector-based ASV systems, some conditions of data augmentation which includes the N-BWE method were carried out. From the experimental results, the method using both upsampled and N-BWE speech as additional training data achieved to 24.5% error reduction.},
 title = {話者照合のための非線形帯域拡張法を用いたデータ拡張の検討},
 year = {2019}
}