ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2024
  4. 2024-SLP-151

VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成

https://ipsj.ixsq.nii.ac.jp/records/232522
https://ipsj.ixsq.nii.ac.jp/records/232522
a7be7b73-985a-4f5d-a420-2c4a67325abf
名前 / ファイル ライセンス アクション
IPSJ-SLP24151052.pdf IPSJ-SLP24151052.pdf (2.4 MB)
Copyright (c) 2024 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-02-22
タイトル
タイトル VQ-VAEに基づく解釈可能なアクセント潜在変数を用いた多方言音声合成
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション2 SP/SLP
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者所属(英)
en
The University of Tokyo
著者名 山内, 一輝

× 山内, 一輝

山内, 一輝

Search repository
齋藤, 佑樹

× 齋藤, 佑樹

齋藤, 佑樹

Search repository
猿渡, 洋

× 猿渡, 洋

猿渡, 洋

Search repository
著者名(英) Kazuki, Yamauchi

× Kazuki, Yamauchi

en Kazuki, Yamauchi

Search repository
Yuki, Saito

× Yuki, Saito

en Yuki, Saito

Search repository
Hiroshi, Saruwatari

× Hiroshi, Saruwatari

en Hiroshi, Saruwatari

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,目的話者の母方言と同じ方言のテキスト音声合成 (Text-to-Speech: TTS) を目的とする “Intra-dialect TTS” および,話者の声質を保ったまま目的話者の母方言と異なる方言の TTS を目的とする “Cross-dialect TTS” という 2 つのタスクに取り組む.従来法は,東京方言(標準語)を除く方言には入力テキストにアクセントラベルを付与するために必要なアクセント辞書が存在しないという困難を克服するため,アクセント潜在変数 (Accent Latent Variable: ALV) を参照音声から抽出するかテキストから予測して方言 TTS に利用する.しかし,従来法では参照音声は学習データに含まれる話者による音声に限られ,Cross-dialect TTS については検討されていない.本稿では,任意の話者による参照音声入力や方言に応じた ALV 予測が可能な多方言 TTS 手法を提案する.実験的評価により,提案手法が特に Cross-dialect TTS において合成音声の方言らしさを向上させることを示す.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2024-SLP-151, 号 52, p. 1-6, 発行日 2024-02-22
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:25:11.492512
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3