WEKO3
-
RootNode
アイテム
調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良
https://ipsj.ixsq.nii.ac.jp/records/71586
https://ipsj.ixsq.nii.ac.jp/records/7158653afebc4-adaf-474b-b808-b3d3ef735808
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-12-13 | |||||||
タイトル | ||||||||
タイトル | 調音運動HMM音声合成における調音特徴-声道パラメータ変換と音源の改良 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of Articulatory-Feature to VT Conversion and Sound Source for HMM Speech Synthesis Based on Articulatory Movement | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Session-9 一般(ポスターセッション) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Toyohashi University of Technology | ||||||||
著者名 |
小野田, 高幸
桂田, 浩一
新田, 恒雄
× 小野田, 高幸 桂田, 浩一 新田, 恒雄
|
|||||||
著者名(英) |
Takayuki, Onoda
Kouichi, Katsurada
Tsuneo, Nitta
× Takayuki, Onoda Kouichi, Katsurada Tsuneo, Nitta
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識と合成を同じ調音運動モデルを用いて実現するシステムの開発を行っている.調音特徴を用いて HMM を設計することにより,音声認識と合成に共通な調音運動のワンモデルを実現している.合成では,HMM が生成する調音特徴系列を声道パラメータに変換し,駆動音源と組み合わせることで音声信号を得る.駆動音源は,CELP 符号化を応用した音源構築により音質改善を図る.提案する合成方式は,話者不変量である調音運動を HMM で表現することで音韻性を,また調音運動から声道パラメータへの変換を音韻共通の MLN で表現することで話者性を,各々独立したモジュールとして実装するため,少量の音声試料で特定話者の音声を合成できる可能性がある.評価実験では,被験者 10 名に対して受聴試験を行い,合成音の品質と声質 (個人性) を評価する.その結果,二文の適応で品質・個人性ともに良好な結果を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We are developing a speech recognition and synthesis system using common models of articulatory movement. By representing HMMs with articulatory features, we have achieved one-model speech recognition and synthesis. In the speech synthesis part, articulatory feature sequences generated by HMMs are converted into vocal tract parameters, and then they are combined with sound source. CELP coding technique is applied to improve sound quality when generating sound source. The proposed speech synthesis system separate phonetic information and speaker individuality. Therefore, it is expected to synthesize target speaker's speech using a small amount of voice data. In the experiments, we carried out listening tests for 10 subjects and evaluated both of sound quality and individuality of synthesized speech. As a result, we confirmed that the proposed synthesis system can produce good quality speech of target speaker with only two sentences. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2010-SLP-84, 号 30, p. 1-6, 発行日 2010-12-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |