マルチチャネル音声強調のための時間領域畳み込みデノイジングオートエンコーダ

俵, 直弘; 小林, 哲則; 小川, 哲司; Naohiro, Tawara; Tetsunori, Kobayashi; Tetsuji, Ogawa

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

マルチチャネル音声強調のための時間領域畳み込みデノイジングオートエンコーダ

https://ipsj.ixsq.nii.ac.jp/records/200780

名前 / ファイル	ライセンス	アクション
IPSJ-SLP19130001.pdf (1.2 MB)	Copyright (c) 2019 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員：¥0, DLIB:会員：¥0

Item type

SIG Technical Reports(1)

公開日

2019-11-29

タイトル

マルチチャネル音声強調のための時間領域畳み込みデノイジングオートエンコーダ

タイトル

言語

タイトル

Time-domain convolutional denoising autoencoder for multi-channel speech enhancement

言語

jpn

キーワード

主題Scheme

Other

主題

セッション1：深化する音声言語処理

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

早稲田大学情報通信学科／現在，日本電信電話株式会社NTTコミュニケーション科学基礎研究所

著者所属

早稲田大学情報通信学科

著者所属

早稲田大学情報通信学科

著者所属(英)

Department of Commimications and Computer Engineering, Waseda University / Presently with the NTT Communication Science Laboratories, NTT Corporation

著者所属(英)

Department of Commimications and Computer Engineering, Waseda University

著者所属(英)

Department of Commimications and Computer Engineering, Waseda University

著者名

俵, 直弘
小林, 哲則
小川, 哲司

著者名(英)

Naohiro, Tawara
Tetsunori, Kobayashi
Tetsuji, Ogawa

論文抄録

内容記述タイプ

Other

内容記述

時間領域畳み込みデノイジングオートエンコーダ (time-domain convolutional denoising autoencoder ; TCDAE) に基づくマルチチャンネル音源強調法を提案する．近年提案された TCDAE に基づく音声強調法では，ノイズ環境下音声波形からクリーン音声波形へのマッピングを時間領域で直接推定することで，位相の推定を行うことなく高い品質の強調音声が得られることが知られている．本研究はこれまでシングルチャネル信号にしか適用されてこなかった TCDAE をマルチチャンネル信号に適用することで，特定の音源方向を強調する空間フィルタに類する機能が得られることを示す．本手法をマルチチャンネル音声強調問題に適用し，signal-to-distortion ratio, perceptual evaluation of speech quality および音声認識時の単語誤り率で強調音声を評価することで，従来のシングルチャネル TCDAE や最小分散無歪応答ビームフォーマに基づく手法よりも高い品質の強調音声が得られることを示した．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2019-SLP-130, 号 1, p. 1-6, 発行日 2019-11-29

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 21:14:50.438476

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

マルチチャネル音声強調のための時間領域畳み込みデノイジングオートエンコーダ

× 俵, 直弘

× 小林, 哲則

× 小川, 哲司

× Naohiro, Tawara

× Tetsunori, Kobayashi

× Tetsuji, Ogawa

Versions

Share

Cite as

エクスポート