ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2021
  4. 2021-NL-251

感情次元の操作を目的とした声質変換手法の提案

https://ipsj.ixsq.nii.ac.jp/records/214085
https://ipsj.ixsq.nii.ac.jp/records/214085
ffe6314b-0117-4e65-b77d-7b25383b8660
名前 / ファイル ライセンス アクション
IPSJ-NL21251022.pdf IPSJ-NL21251022.pdf (1.3 MB)
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
NL:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2021-11-24
タイトル
タイトル 感情次元の操作を目的とした声質変換手法の提案
タイトル
言語 en
タイトル An approach to voice conversion for manipulating emotion dimensions
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声合成
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
宇都宮大学大学院地域創生科学研究科
著者所属
宇都宮大学工学部
著者所属(英)
en
Graduate School of Regional Development and Creativity, Utsunomiya University
著者所属(英)
en
Faculty of Engineering, Utsunomiya University
著者名 向田, 圭汰

× 向田, 圭汰

向田, 圭汰

Search repository
森, 大毅

× 森, 大毅

森, 大毅

Search repository
著者名(英) Keita, Mukada

× Keita, Mukada

en Keita, Mukada

Search repository
Hiroki, Mori

× Hiroki, Mori

en Hiroki, Mori

Search repository
論文抄録
内容記述タイプ Other
内容記述 感情次元による連続的な感情表記法に基づいた声質変換手法を提案する.一般的な離散的な感情表記法に基づく感情の声質変換は,変換元と変換先の感情状態に対応するコーパスを用意して学習する.しかし,次元に基づく連続的な感情表記法ではデータセットを変換元と変換先に分割することはできない.本報告では,変換元と変換先の感情次元の差分をサンプリングにより生成することで声質変換モデルを学習する方法を提案する.このモデルは声質変換を担う Generator と変換音声の肉声らしさを検査する Discriminator の競合学習に基づく.Generator には音声の特徴量に加え変換先への感情次元の差分を入力する.Discriminator には音声の特徴量に加えその感情次元を入力し,音声の肉声らしさとその感情次元の妥当性を判別する.
論文抄録(英)
内容記述タイプ Other
内容記述 We propose an emotional voice conversion method based on the emotion dimensions. Conventional emotional voice conversion assumes a dataset that consists of disjoint subsets of categorical emotion. However, it is impossible to divide the dataset into the source domain and the target domain when adopting the emotion dimensions. In this paper, we propose a method of constructing an emotional voice conversion model by the sampling of the difference to the target emotion over the dimensional space of emotion. The model is based on the competitive learning of the Generator that performs the voice conversion, and the Discriminator that assesses the genuineness of the converted speech. The Generator receives the speech features as well as the difference of emotion dimensions to the target emotional states. The Discriminator receives the speech features as well as the emotion dimensions of the speech, to check whether the emotion is being expressed by the input speech.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2021-NL-251, 号 22, p. 1-3, 発行日 2021-11-24
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8779
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 16:54:27.655806
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3