WEKO3
アイテム
音素単位で話速制御を行うGAN-TTS
https://ipsj.ixsq.nii.ac.jp/records/197815
https://ipsj.ixsq.nii.ac.jp/records/197815ec2729d3-7992-4fd2-b8fa-5ce761ab2a49
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2019 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2019-06-15 | |||||||||||
タイトル | ||||||||||||
タイトル | 音素単位で話速制御を行うGAN-TTS | |||||||||||
タイトル | ||||||||||||
言語 | en | |||||||||||
タイトル | Phoneme Level Variable Speaking Rate Control in GAN-TTS | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | ポスターセッション1 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学 | ||||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター,AIP | ||||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学/理化学研究所革新知能統合研究センター,AIP | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NAIST | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NAIST / AIP | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
NAIST / AIP | ||||||||||||
著者名 |
岡本, 真由子
× 岡本, 真由子
× Sakriani, Sakti
× 中村, 哲
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | テキスト音声合成 (TTS) は入力された文から音声を生成する技術で,学習に公開されている読み上げ音声データが多用されている.そのため,合成された音声が自然発話と異なり単調になり,対話システムなど自然発話を想定したシステムに用いる場合に違和感が生じてしまう.本稿では,話速などの非言語情報を考慮した上で音声の自然性を損なわない音声合成の実現を目指す.自然発話では,発話速度の変化は単語や句の単位のみでなく,任意の音ごとに変化することがあるため,本稿では音素ごとに話速を制御するため,各音素に対して,敵対的生成ネットワークを用いた音声合成 (GANTTS) [1] を用いて話速情報を付与する方法を提案する.また,独自に話速の異なる音声データ6,792 発話を収録した.その結果,提案手法は合成音声の波形を人工的に操作するよりも自然で,かつ音素単位で適切な話速変化を行うことができることを示した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10438388 | |||||||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2019-MUS-123, 号 30, p. 1-5, 発行日 2019-06-15 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8752 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |