WEKO3
アイテム
SHAREVOX -多彩な表現が可能なテキスト音声合成ソフトウェアの開発とモデルアーキテクチャの改善-
https://ipsj.ixsq.nii.ac.jp/records/230011
https://ipsj.ixsq.nii.ac.jp/records/2300117fa6798c-5bf4-4739-af93-58ee680f28a7
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-16 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | SHAREVOX -多彩な表現が可能なテキスト音声合成ソフトウェアの開発とモデルアーキテクチャの改善- | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 電通大 | ||||||||||||||
| 著者名 |
芦田, 裕飛
× 芦田, 裕飛
× 寺内, 健人
× 本部, 勇真
× 柳井, 啓司
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 近年, 深層学習の発展により, テキスト音声合成(TTS)は大きく進歩している.実際にソフトウェアに搭載する音声合成システムには, 単にTTSを行うだけでなく, 多彩な表現が可能かつ, 高速に動作することが求められる.そこで, 既存ソフトウェアの派生ソフトウェアとして, 音声や表現を調整可能なテキスト音声合成システムを搭載したSHAREVOXを開発, リリースした.この論文では, 多彩な表現を持ったまま, より自然な音声合成を実現するにあたり, VAEやSource-Filterモデルの導入, 推論の高速化のための並列計算モデルの導入など, 全体的なモデルの改善, 検討を行う. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||
| 書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 431-432, 発行日 2023-02-16 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||