ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2021
  4. 2021-SLP-139

VQVAEによって獲得されたキャラクター演技スタイルに基づく多話者オーディオブック音声合成

https://ipsj.ixsq.nii.ac.jp/records/214117
https://ipsj.ixsq.nii.ac.jp/records/214117
2a9aec91-43e0-4092-b09e-ccd03255eff5
名前 / ファイル ライセンス アクション
IPSJ-SLP21139023.pdf IPSJ-SLP21139023.pdf (1.4 MB)
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2021-11-24
タイトル
タイトル VQVAEによって獲得されたキャラクター演技スタイルに基づく多話者オーディオブック音声合成
タイトル
言語 en
タイトル Multi-speaker Audiobook Speech Synthesis using Discrete Character Acting Styles Acquired by VQVAE
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声合成
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属
日本電信電話株式会社
著者所属
日本電信電話株式会社
著者所属
東京大学
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
Nippon Telegraph and Telephone Corporation
著者所属(英)
en
Nippon Telegraph and Telephone Corporation
著者所属(英)
en
The University of Tokyo
著者名 中田, 亘

× 中田, 亘

中田, 亘

Search repository
郡山, 知樹

× 郡山, 知樹

郡山, 知樹

Search repository
高道, 慎之介

× 高道, 慎之介

高道, 慎之介

Search repository
齋藤, 佑樹

× 齋藤, 佑樹

齋藤, 佑樹

Search repository
井島, 勇祐

× 井島, 勇祐

井島, 勇祐

Search repository
増村, 亮

× 増村, 亮

増村, 亮

Search repository
猿渡, 洋

× 猿渡, 洋

猿渡, 洋

Search repository
著者名(英) Wataru, Nakata

× Wataru, Nakata

en Wataru, Nakata

Search repository
Tomoki, Koriyama

× Tomoki, Koriyama

en Tomoki, Koriyama

Search repository
Shinnosuke, Takamichi

× Shinnosuke, Takamichi

en Shinnosuke, Takamichi

Search repository
Yuki, Saito

× Yuki, Saito

en Yuki, Saito

Search repository
Yusuke, Ijima

× Yusuke, Ijima

en Yusuke, Ijima

Search repository
Ryo, Masumura

× Ryo, Masumura

en Ryo, Masumura

Search repository
Hiroshi, Saruwatari

× Hiroshi, Saruwatari

en Hiroshi, Saruwatari

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では,Vector Quantized Variational AutoEncoder (VQVAE) を用いたキャラクター演技スタイルの抽出,及びそれを用いた多話者オーディオブック音声合成を提案する.声優によるオーディオブック音声では,登場人物の属性などにより異なるキャラクター演技スタイルが含まれため,オーディオブック音声合成においても異なるキャラクター演技スタイルを実現することが望まれる.一方で,テキスト情報のみから登場人物の属性と対応するキャラクター演技スタイルを推測することは困難である.そこで本研究では,音声からキャラクター演技スタイルを抽出しそれに基づく多話者オーディオブック音声合成を提案する.主観評価では,提案法を用いることにより,より原音声に近いキャラクター演技スタイルが実現できることが確認された.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we propose a method of extracting discrete character acting styles using vector quantized variational autoencoder (VQVAE) and multi-speaker audiobook speech synthesis based on extracted character acting styles. In audiobook corpora uttered by voice talents, the speech utterances contain acting depending on the character’s attributes. Such acting should also be contained in synthesized audiobooks. However, predicting proper acting style and character attributes is still a hard challenge. To this end, we propose a method for extracting character acting styles from audiobook speech and conditioning TTS models by the extracted character acting styles to synthesize speech with character acting. The subjective evaluation shows that the proposed method achieves a closer character acting style to the ground truth speech.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2021-SLP-139, 号 23, p. 1-6, 発行日 2021-11-24
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 16:53:43.681817
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3