Fed-StarGANv2-VC：連合学習を用いた多対多声質変換

平井, 龍之介; 齋藤, 佑樹; 猿渡, 洋; Ryunosuke, Hirai; Yuki, Saito; Hiroshi, Saruwatari

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

Fed-StarGANv2-VC：連合学習を用いた多対多声質変換

https://ipsj.ixsq.nii.ac.jp/records/224408

名前 / ファイル	ライセンス	アクション
IPSJ-SLP23146011.pdf (1.1 MB) 2025年2月21日からダウンロード可能です。	Copyright (c) 2023 by the Information Processing Society of Japan
非会員：¥660, IPSJ:学会員：¥330, SLP:会員：¥0, DLIB:会員：¥0

Item type

SIG Technical Reports(1)

公開日

2023-02-21

タイトル

Fed-StarGANv2-VC：連合学習を用いた多対多声質変換

言語

jpn

キーワード

主題Scheme

Other

主題

SLP

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

東京大学

著者所属

東京大学

著者所属

東京大学

著者名

平井, 龍之介
齋藤, 佑樹
猿渡, 洋

著者名(英)

Ryunosuke, Hirai
Yuki, Saito
Hiroshi, Saruwatari

論文抄録

内容記述タイプ

Other

内容記述

本稿では，連合学習を用いたユーザ参加型の多対多声質変換モデル学習法を提案する．従来の多対多声質変換技術は，多数話者の音声を含むデータセットを用いて声質変換モデルを学習する．しかし，学習されたモデルが多種多様なユーザによる入力音声に対して高品質な声質変換を実現する保証はない．提案手法では，高品質な多対多声質変換を実現する StarGANv2-VC モデルを研究開発者とユーザが協同的に学習し，ユーザが所有する音声データのプライバシーを保護しながら，より多様な話者の音声を変換可能な深層学習モデルを構築する．実験的評価の結果より，提案手法が従来の非分散型学習法と同程度の話者類似性を達成しうることを示す．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2023-SLP-146, 号 11, p. 1-8, 発行日 2023-02-21

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 13:09:43.883867

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

Fed-StarGANv2-VC：連合学習を用いた多対多声質変換

× 平井, 龍之介

× 齋藤, 佑樹

× 猿渡, 洋

× Ryunosuke, Hirai

× Yuki, Saito

× Hiroshi, Saruwatari

Versions

Share

Cite as

エクスポート