ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2016
  4. 2016-SLP-114

統計的パラメトリック音声合成のための敵対的学習に基づくポストフィルタリング

https://ipsj.ixsq.nii.ac.jp/records/176406
https://ipsj.ixsq.nii.ac.jp/records/176406
2e4b3162-56d1-4508-958a-95f77c18593f
名前 / ファイル ライセンス アクション
IPSJ-SLP16114020.pdf IPSJ-SLP16114020.pdf (646.9 kB)
Copyright (c) 2016 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2016-12-13
タイトル
タイトル 統計的パラメトリック音声合成のための敵対的学習に基づくポストフィルタリング
タイトル
言語 en
タイトル Generative Adversarial Network-based Postfiltering for Statistical Parametric Speech Synthesis
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声合成
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
NTTコミユニケーシヨン科学基礎研究所
著者所属
NTTコミユニケーシヨン科学基礎研究所
著者所属
NTTメディアインテリジェンス研究所
著者所属
NTTメディアインテリジェンス研究所
著者所属
NTTコミユニケーシヨン科学基礎研究所
著者所属
NTTコミユニケーシヨン科学基礎研究所
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
NTT Media Intelligence Laboratories
著者所属(英)
en
NTT Media Intelligence Laboratories
著者所属(英)
en
NTT Communication Science Laboratories
著者所属(英)
en
NTT Communication Science Laboratories
著者名 金子, 卓弘

× 金子, 卓弘

金子, 卓弘

Search repository
亀岡, 弘和

× 亀岡, 弘和

亀岡, 弘和

Search repository
北条, 伸克

× 北条, 伸克

北条, 伸克

Search repository
井島, 勇祐

× 井島, 勇祐

井島, 勇祐

Search repository
平松, 薫

× 平松, 薫

平松, 薫

Search repository
柏野, 邦夫

× 柏野, 邦夫

柏野, 邦夫

Search repository
著者名(英) Takuhiro, Kaneko

× Takuhiro, Kaneko

en Takuhiro, Kaneko

Search repository
Hirokazu, Kameoka

× Hirokazu, Kameoka

en Hirokazu, Kameoka

Search repository
Nobukatsu, Hojo

× Nobukatsu, Hojo

en Nobukatsu, Hojo

Search repository
Yusuke, Ijima

× Yusuke, Ijima

en Yusuke, Ijima

Search repository
Kaoru, Hiramatsu

× Kaoru, Hiramatsu

en Kaoru, Hiramatsu

Search repository
Kunio, Kashino

× Kunio, Kashino

en Kunio, Kashino

Search repository
論文抄録
内容記述タイプ Other
内容記述 統計的パラメトリック音声合成は,その柔軟性と省メモリ性などの利点により広く使われている. しかし,この手法で生成した音声パラメータは,学習の際の統計的平均化によって過剰な平滑化が生じ,合成した音声は肉声感が失われる傾向がある. この問題に対し,本稿では,敵対的学習を用いて取得したポストフイルタを用いることにより,失われた肉声感を再構成する手法を提案する.従来研究でも,系列内変動や変調スペクトルに着目して肉声感を取り戻そうという試みはあるが,これらは経験的発見に基づくものであり,合成音声と自然音声の差異の一部に対処しているに過ぎない. これに対して,提案手法は敵対的学習を用いながら,合成音声と自然音声とのギャップを埋めるようなポストフイルタをデータから直接学習しようとするものである. これにより,合成音声の音声特徴量を真の音声の音声特徴量の分布に近づくように変換するポストフイルタを得ることができる.実験では,提案手法を用いることにより,合成音声から分析合成音声に匹敵する音声が得られることを示す.
論文抄録(英)
内容記述タイプ Other
内容記述 In the field of speech synthesis, statistical parametric speech synthesis has been widely used due to the flexibility and compactness. However, the quality of its synthesized speech is degraded by over-smoothing and there is a large quality gap between natural and synthesized speech. To fill the gap, we propose a novel postfilter based on a generative adversarial network (GAN). There have been several attempts to alleviate over-smoothing like ours ; however, they are based on empirical findings about acoustic differences between natural and synthesized speech. Therefore, they cannot cover all the factors causing the differences. In contrast, we examine a learning-based postfilter and learn how to compensate for the differences directly from the data. In particular, we utilize a GAN and optimize a generator (i.e., postfilter) and a discriminator in an adversarial process. This enables us to obtain the postfilter to fit the true data distribution. Experimental results show that the speech generated by our proposed method is comparable to analyzed-and-synthesized speech.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2016-SLP-114, 号 20, p. 1-6, 発行日 2016-12-13
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 05:53:02.807205
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3