@techreport{oai:ipsj.ixsq.nii.ac.jp:00234739, author = {菅野, 滉大 and 高道, 慎之介 and 塩田, さやか}, issue = {52}, month = {Jun}, note = {本論文では,話者照合となりすまし音声検出のための日本語音声コーパス Japanese Spoofing Attack,recorded in-the-Wild (J-SpAW) の概要について紹介する.声の生体認証技術である話者照合は深層学習の発展に伴い大幅な性能改善がなされた.一方で,録音再生技術の簡易化や音声合成技術の発展にともない,話者照合へのなりすまし音声攻撃に対する対策についても急務となってきている.特に深層学習に基づく手法が研究の主流となってきている状況では,研究促進に必要となるのは多様な音声コーパスであるといえる.しかしながら,話者照合となりすまし音声検出のための音声コーパスはなりすまし音声検出のコンペティションである ASVspoof challenge で公開されているものがほとんどであり,収録状況や言語の多様性などが不十分であった.そこで本研究では,日本語話者による話者照合およびなりすまし音声検出の評価が可能となる音声コーパス J-SpAW を構築し,音声コーパスとしての性能を調査した.実験では J-SpAW を用いて話者照合を行い,話者照合としては高い性能が得られることを確認した.また,J-SpAW を用いてなりすまし音声を作成し,なりすまし音声検出の様々なベースラインモデルでなりすまし音声検出の評価を行ったところ,なりすまし音声検出の検出性能が非常に低く,既存のモデルでは話者照合と組み合わせたときにもなりすまし音声検出の精度はまだ不十分であることが確認された.これらの結果から,J-SpAW は,話者照合となりすまし音声攻撃の検出両方を同時に評価できる新たな音声コーパスとして使用可能であることを報告する.}, title = {J-SpAW:話者照合となりすまし音声検出のための日本語音声コーパス}, year = {2024} }