WEKO3
アイテム
HMM音声合成における不特定話者スタイル変換の検討
https://ipsj.ixsq.nii.ac.jp/records/79375
https://ipsj.ixsq.nii.ac.jp/records/7937549dc4ce1-6570-4b09-b64c-2fcfd39645eb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2100年1月1日からダウンロード可能です。
|
Copyright (c) 2011 by the Institute of Electronics, Information and Communication Engineers
This SIG report is only available to those in membership of the SIG. |
|
SLP:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-12 | |||||||
タイトル | ||||||||
タイトル | HMM音声合成における不特定話者スタイル変換の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on Speaker-Independent Style Conversion in HMM Speech Synthesis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声合成 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科物理情報システム専攻 | ||||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科物理情報システム専攻 | ||||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科物理情報システム専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology | ||||||||
著者名 |
金川, 裕紀
× 金川, 裕紀
|
|||||||
著者名(英) |
Hiroki, Kanagawa
× Hiroki, Kanagawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では隠れマルコフモデル (HMM) に基づく音声合成において,目標話者の読上げスタイルの音声のみから異なる目標スタイルの音声を生成する手法を提案する.従来,読上げスタイルモデルから少量の目標スタイル音声を用いてスタイル適応を行うことにより目標スタイルの任意の文章を合成する手法が提案されているが,目標スタイルの音声が得られない場合にはこの手法を利用することはできない.提案法では,あらかじめ複数の話者により学習された読上げスタイルモデルに対し,同じ話者による目標スタイルへのスタイル変換を線形変換により表現する.これにより得られる変換行列は特定の話者に依存しない不特定話者のスタイル変換を表すため,これを目標話者の読上げスタイルモデルに適用することで目標話者の目標スタイル音声が利用できない場合についてもスタイル音声の合成が可能となる.評価実験では変換後の合成音声について話者性,スタイル再現性および自然性の 3 つの観点から提案法の有効性を検討する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a technique for synthesizing speech of a desired style using speaker-independent style conversion in HMM-based speech synthesis. The HMM-based style adaptation technique has been proposed that can synthesize speech of arbitrary sentences with a target style. However, this technique cannot be used when the speech data of the target style is not available. To overcome the problem, we extend the speaker-dependent style conversion in the style adaptation to speaker-independent one. Specifically, first we prepare neutral- and target-style speech data of multiple speakers and train a neutral-style average voice model. The style conversion from the average voice model to the target style one is trained using linear transformation. We then apply the transformation matrices to the neutral-style model of the target speaker. Finally, we obtain the target-style model of the target speaker and synthesize the style-converted speech. We evaluate the proposed technique in terms of speaker and style characteristics and naturalness. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2011-SLP-89, 号 32, p. 1-6, 発行日 2011-12-12 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |