ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2022
  4. 2022-SLP-140

多話者音声合成のためのAdversarial Regularizer を考慮した学習アルゴリズム

https://ipsj.ixsq.nii.ac.jp/records/216610
https://ipsj.ixsq.nii.ac.jp/records/216610
93530230-a616-4c5c-bdbd-a6c877360e6b
名前 / ファイル ライセンス アクション
IPSJ-SLP22140009.pdf IPSJ-SLP22140009.pdf (1.6 MB)
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2022-02-22
タイトル
タイトル 多話者音声合成のためのAdversarial Regularizer を考慮した学習アルゴリズム
言語
言語 jpn
キーワード
主題Scheme Other
主題 SP1
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者名 仲井, 佑友輔

× 仲井, 佑友輔

仲井, 佑友輔

Search repository
齋藤, 佑樹

× 齋藤, 佑樹

齋藤, 佑樹

Search repository
宇田川, 健太

× 宇田川, 健太

宇田川, 健太

Search repository
猿渡, 洋

× 猿渡, 洋

猿渡, 洋

Search repository
著者名(英) Yusuke, Nakai

× Yusuke, Nakai

en Yusuke, Nakai

Search repository
Yuki, Saito

× Yuki, Saito

en Yuki, Saito

Search repository
Kenta, Udagawa

× Kenta, Udagawa

en Kenta, Udagawa

Search repository
Hiroshi, Saruwatari

× Hiroshi, Saruwatari

en Hiroshi, Saruwatari

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,Adversarial Reguralizer を考慮した敵対学習による多話者音声合成モデルを提案する.従来法では,識別的なタスクによって事前学習した Speaker Encoder から目的話者の話者埋め込みを抽出し,音声合成ネットワークに入力を行う.しかし,学習された話者埋め込みの分布する特徴量空間は音声合成ネットワークにとって必ず しも解釈性が高いとは限らず,未知話者の話者埋め込みを上手く抽出できる保証が無いという問題があった.提案法 では,事前学習済みの話者埋め込み空間をうまく解釈できる音声合成ネットワークの構築を目的とし,学習アルゴリ ズムとして Adversarial Reguralizer を考慮した敵対学習を提案する.提案法では,話者埋め込みを混合して合成した音声の特徴量と,自然音声の特徴量が識別不可能となるような正則化項を考慮して音声合成ネットワークを学習する. 実験的評価により,提案法が合成音声の話者類似性と,話者モーフィングの操作性を改善する傾向にあることを示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2022-SLP-140, 号 9, p. 1-6, 発行日 2022-02-22
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 15:47:40.704519
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3