Item type |
SIG Technical Reports(1) |
公開日 |
2019-11-29 |
タイトル |
|
|
タイトル |
マルチチャネル音声強調のための時間領域畳み込みデノイジングオートエンコーダ |
タイトル |
|
|
言語 |
en |
|
タイトル |
Time-domain convolutional denoising autoencoder for multi-channel speech enhancement |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
セッション1:深化する音声言語処理 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学情報通信学科/現在,日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
著者所属 |
|
|
|
早稲田大学情報通信学科 |
著者所属 |
|
|
|
早稲田大学情報通信学科 |
著者所属(英) |
|
|
|
en |
|
|
Department of Commimications and Computer Engineering, Waseda University / Presently with the NTT Communication Science Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
Department of Commimications and Computer Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Department of Commimications and Computer Engineering, Waseda University |
著者名 |
俵, 直弘
小林, 哲則
小川, 哲司
|
著者名(英) |
Naohiro, Tawara
Tetsunori, Kobayashi
Tetsuji, Ogawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
時間領域畳み込みデノイジングオートエンコーダ (time-domain convolutional denoising autoencoder ; TCDAE) に基づくマルチチャンネル音源強調法を提案する.近年提案された TCDAE に基づく音声強調法では,ノイズ環境下音声波形からクリーン音声波形へのマッピングを時間領域で直接推定することで,位相の推定を行うことなく高い品質の強調音声が得られることが知られている.本研究はこれまでシングルチャネル信号にしか適用されてこなかった TCDAE をマルチチャンネル信号に適用することで,特定の音源方向を強調する空間フィルタに類する機能が得られることを示す.本手法をマルチチャンネル音声強調問題に適用し,signal-to-distortion ratio, perceptual evaluation of speech quality および音声認識時の単語誤り率で強調音声を評価することで,従来のシングルチャネル TCDAE や最小分散無歪応答ビームフォーマに基づく手法よりも高い品質の強調音声が得られることを示した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2019-SLP-130,
号 1,
p. 1-6,
発行日 2019-11-29
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |