ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2017
  4. 2017-SLP-118

雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習

https://ipsj.ixsq.nii.ac.jp/records/183679
https://ipsj.ixsq.nii.ac.jp/records/183679
309d2858-6222-4a63-801a-cae457b18ada
名前 / ファイル ライセンス アクション
IPSJ-SLP17118001.pdf IPSJ-SLP17118001.pdf (1.3 MB)
Copyright (c) 2017 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2017-10-06
タイトル
タイトル 雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習
タイトル
言語 en
タイトル Generative adversarial training of the noise generation model for speech synthesis using speech in noise
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
徳山工業高等専門学校/東京大学大学院情報理工学系研究科
著者所属
東京大学大学院情報理工学系研究科
著者所属
東京大学大学院情報理工学系研究科
著者所属
東京大学大学院情報理工学系研究科
著者所属
徳山工業高等専門学校
著者所属
東京大学大学院情報理工学系研究科
著者所属(英)
en
National Institute of Technology, Tokuyama College / The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
National Institute of Technology, Tokuyama College
著者所属(英)
en
The University of Tokyo
著者名 宇根, 昌和

× 宇根, 昌和

宇根, 昌和

Search repository
齋藤, 佑樹

× 齋藤, 佑樹

齋藤, 佑樹

Search repository
高道, 慎之介

× 高道, 慎之介

高道, 慎之介

Search repository
北村, 大地

× 北村, 大地

北村, 大地

Search repository
宮崎, 亮一

× 宮崎, 亮一

宮崎, 亮一

Search repository
猿渡, 洋

× 猿渡, 洋

猿渡, 洋

Search repository
著者名(英) Masakazu, Une

× Masakazu, Une

en Masakazu, Une

Search repository
Yuki, Saito

× Yuki, Saito

en Yuki, Saito

Search repository
Shinnnosuke, Takamichi

× Shinnnosuke, Takamichi

en Shinnnosuke, Takamichi

Search repository
Daichi, Kitamura

× Daichi, Kitamura

en Daichi, Kitamura

Search repository
Ryoichi, Miyazaki

× Ryoichi, Miyazaki

en Ryoichi, Miyazaki

Search repository
Hiroshi, Saruwatari

× Hiroshi, Saruwatari

en Hiroshi, Saruwatari

Search repository
論文抄録
内容記述タイプ Other
内容記述 高品質な統計的パラメトリック音声合成システムの構築には,スタジオ等の理想的な環境で収録された音声データの利用が不可欠であるため,現存する膨大な音声データのうち,音声合成の学習に利用可能なものは非常に限定される.本稿では,雑音環境下音声から高品質な音声合成を構築する方法を提案する.従来,そのような音声を学習データとして用いる場合,spectral subtraction 等の雑音抑圧処理を施した後に,通常の音声合成の学習を行う.しかしながら,雑音スペクトルの生成分布をパラメトリックに定義する雑音抑圧法は処理後の音声を歪ませ,さらに,その歪みは音声合成の学習時に増幅されて合成音声品質を悪化させる.そこで本稿では,敵対的学習アルゴリズムにより学習される雑音生成モデルを用いた,音声合成の学習法を提案する.雑音生成モデルは,観測雑音スペクトルの統計量を持つように学習され,雑音スペクトルを確率的に生成する.テキストから音声スペクトルを生成する音声合成モデルは,生成雑音を加算した後のスペクトルが雑音環境下音声のスペクトルに一致するように学習される.提案法は,雑音スペクトルの生成分布を柔軟にモデル化でき,さらに,雑音加算過程を考慮して音声合成モデルを学習するため,従来法において生じる品質低下を低減できる.実験的評価では,いくつかの雑音抑圧強度と SN 比において合成音声を作成し,提案法の知覚的音質が従来法を上回ることを示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2017-SLP-118, 号 1, p. 1-6, 発行日 2017-10-06
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 03:34:17.964051
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3