Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
局所的な真偽判定を用いた敵対的学習に基づく教師なし音声処理歪み補正 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Unsupervised artifacts correction based on generative adversarial learning with local true-false decisions |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
早稲田大学 |
著者所属 |
|
|
|
沖電気工業学 |
著者所属 |
|
|
|
早稲田大学 |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Oki Electric Corporation |
著者所属(英) |
|
|
|
en |
|
|
Waseda University |
著者名 |
荻野, 里久
西城, 耕平
藤枝, 大
小川, 哲司
|
著者名(英) |
Riku, Ogino
Kohei, Saijo
Masaru, Fujieda
Tetsuji, Ogawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,収音したいエリアに含まれる音源を強調するエリア収音の後処理として用いる歪み補正器を,教師無し学習する方式について検討した.エリア収音は非線形なアプローチに基づく音声強調処理である.目的音と同方向に妨害音が配置されているなど,線形のビームフォーミングに基づく手法では目的音の強調が困難な場面で用いられるが,人工的な処理歪みがスペクトル上で局所的に生じるという課題を持つ.先行研究では,観測信号と正解信号の対 (ペアデータ) を用いた教師あり学習により,処理歪みを低減するネットワークの学習が行われた.しかし,実環境において正解信号を大量に得ることは現実的でなく,正解信号なしにネットワークを学習できることが望ましい.そこで本研究では,教師なし敵対的生成ネットワーク (GAN) の枠組みを用い,人工的な歪みを補正するネットワークの構築を試みた.また,局所的に生じる処理歪みを効果的に補正するために,敵対的学習における識別器に真偽判定を局所的に行える枠組みを適用した.妨害音と同方向にある目的音を強調する実験において,エリア収音の出力信号で生じた歪みを提案方式で補正することの有効性を確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This study presents an unsupervised learning method for distortion correction networks used as post-processing for area sound enhancement that aims to extract the sound sources in the area of interest. Area sound enhancement has shown to be effective in situations where the target sound is difficult to be enhanced by linear beamforming-based methods, such as when interfering sounds are located in the same direction as the target sound, but it causes artificial processing distortion locally in the spectrum due to non-linear processing. In previous studies, a network was trained to reduce artifacts by supervised learning using pairs of observed and correct signals (paired data). It, however, is not realistic to obtain a large number of correct signals in a real environment, and it is desirable to be able to learn a network without correct signals. The present study, therefore, attempts to compensate for artificial distortions by using the framework of unsupervised adversarial genera- tive networks (GANs). To effectively compensate for locally generated distortions, we also applied a framework that allows localized true-false judgments to the discriminator in adversarial learning. Experimental comparisons for the enhancement of the target sound in the same direction as the disturbance sound demonstrated the effectiveness of the proposed method in correcting distortions in the output signal of the area sound enhancement. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-142,
号 35,
p. 1-6,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |