雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習

宇根, 昌和; 齋藤, 佑樹; 高道, 慎之介; 北村, 大地; 宮崎, 亮一; 猿渡, 洋; Masakazu, Une; Yuki, Saito; Shinnnosuke, Takamichi; Daichi, Kitamura; Ryoichi, Miyazaki; Hiroshi, Saruwatari

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習

https://ipsj.ixsq.nii.ac.jp/records/183679

名前 / ファイル	ライセンス	アクション
IPSJ-SLP17118001.pdf (1.3 MB)	Copyright (c) 2017 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2017-10-06

タイトル

雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習

タイトル

言語

タイトル

Generative adversarial training of the noise generation model for speech synthesis using speech in noise

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

徳山工業高等専門学校／東京大学大学院情報理工学系研究科

著者所属

東京大学大学院情報理工学系研究科

著者所属

東京大学大学院情報理工学系研究科

著者所属

東京大学大学院情報理工学系研究科

著者所属

徳山工業高等専門学校

著者所属

東京大学大学院情報理工学系研究科

著者所属(英)

National Institute of Technology, Tokuyama College / The University of Tokyo

著者所属(英)

The University of Tokyo

著者所属(英)

The University of Tokyo

著者所属(英)

The University of Tokyo

著者所属(英)

National Institute of Technology, Tokuyama College

著者所属(英)

The University of Tokyo

著者名

宇根, 昌和
齋藤, 佑樹
高道, 慎之介
北村, 大地
宮崎, 亮一
猿渡, 洋

著者名(英)

Masakazu, Une
Yuki, Saito
Shinnnosuke, Takamichi
Daichi, Kitamura
Ryoichi, Miyazaki
Hiroshi, Saruwatari

論文抄録

内容記述タイプ

Other

内容記述

高品質な統計的パラメトリック音声合成システムの構築には，スタジオ等の理想的な環境で収録された音声データの利用が不可欠であるため，現存する膨大な音声データのうち，音声合成の学習に利用可能なものは非常に限定される．本稿では，雑音環境下音声から高品質な音声合成を構築する方法を提案する．従来，そのような音声を学習データとして用いる場合，spectral subtraction 等の雑音抑圧処理を施した後に，通常の音声合成の学習を行う．しかしながら，雑音スペクトルの生成分布をパラメトリックに定義する雑音抑圧法は処理後の音声を歪ませ，さらに，その歪みは音声合成の学習時に増幅されて合成音声品質を悪化させる．そこで本稿では，敵対的学習アルゴリズムにより学習される雑音生成モデルを用いた，音声合成の学習法を提案する．雑音生成モデルは，観測雑音スペクトルの統計量を持つように学習され，雑音スペクトルを確率的に生成する．テキストから音声スペクトルを生成する音声合成モデルは，生成雑音を加算した後のスペクトルが雑音環境下音声のスペクトルに一致するように学習される．提案法は，雑音スペクトルの生成分布を柔軟にモデル化でき，さらに，雑音加算過程を考慮して音声合成モデルを学習するため，従来法において生じる品質低下を低減できる．実験的評価では，いくつかの雑音抑圧強度と SN 比において合成音声を作成し，提案法の知覚的音質が従来法を上回ることを示す．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2017-SLP-118, 号 1, p. 1-6, 発行日 2017-10-06

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-20 03:34:17.964051

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習

× 宇根, 昌和

× 齋藤, 佑樹

× 高道, 慎之介

× 北村, 大地

× 宮崎, 亮一

× 猿渡, 洋

× Masakazu, Une

× Yuki, Saito

× Shinnnosuke, Takamichi

× Daichi, Kitamura

× Ryoichi, Miyazaki

× Hiroshi, Saruwatari

Versions

Share

Cite as

エクスポート