ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2023
  4. 2023-SLP-147

FaderNetを用いた未知話者に対する音声印象変換

https://ipsj.ixsq.nii.ac.jp/records/226392
https://ipsj.ixsq.nii.ac.jp/records/226392
d5f9f4c1-71f5-4714-a54f-b836c7b29aa3
名前 / ファイル ライセンス アクション
IPSJ-SLP23147021.pdf IPSJ-SLP23147021.pdf (1.5 MB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-06-16
タイトル
タイトル FaderNetを用いた未知話者に対する音声印象変換
タイトル
言語 en
タイトル Impression Conversion of Speech for Unknown Speakers Using FaderNet
言語
言語 jpn
キーワード
主題Scheme Other
主題 一般発表
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
電気通信大学
著者所属
電気通信大学
著者所属(英)
en
The University of Electro-Communications
著者所属(英)
en
The University of Electro-Communications
著者名 釘本, 咲

× 釘本, 咲

釘本, 咲

Search repository
中鹿, 亘

× 中鹿, 亘

中鹿, 亘

Search repository
著者名(英) Saki, Kugimoto

× Saki, Kugimoto

en Saki, Kugimoto

Search repository
Toru, Nakashika

× Toru, Nakashika

en Toru, Nakashika

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では声質変換手法の 1 つである FaderNetVC を用いて話者性はそのままに音声の印象のみを変えるという先行研究をもとに印象ラベルを持たない未知話者に対しても印象変換可能なモデルを提案する.FaderNetVC はあらかじめ変換したい音声に話者ラベルを必要とするため,印象変換においても変換したい音声にはあらかじめ印象ラベルを定義しておかなければならないが,外部識別器 (Classifier) を用いてこれを実現する.また従来法では印象ラベルの識別に正規分布を仮定していたが,精度向上のためにベータ分布を仮定した識別器も提案し,仮定する分布の違いによる印象変換性能を比較検討する.
論文抄録(英)
内容記述タイプ Other
内容記述 This paper proposes a model that can convert impressions of unknown speakers who do not have impression labels, based on a previous study that used FaderNetVC, a voice conversion method, to change only the impression of speech without changing the speaker’s identity. Since FaderNetVC requires a speaker label for the speech to be converted in advance, an impression label must be defined for the speech to be converted in advance for impression conversion. This is achieved by adding ‘Classifier’ to the model. In addition, we propose a discriminator that assumes a beta distribution to improve the accuracy of the conventional method, which assumes a normal distribution for modelling impression labels.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2023-SLP-147, 号 21, p. 1-4, 発行日 2023-06-16
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:29:26.805689
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3