2024-03-29T00:16:24Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001073532023-04-27T10:00:04Z01164:05159:07427:07760
統計モデルに基づいた柔軟な音声合成-人間のように喋る機械の実現を目指して-Statistical approach to flexible speech synthesis: towards human-like talking machinesjpn招待講演http://id.nii.ac.jp/1001/00107329/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=107353&item_no=1&attribute_id=1&file_no=1Copyright (c) 2014 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.名古屋工業大学/Google徳田, 恵一本講演では,統計的パラメトリック音声合成について述べる.人間のように喋る機械を実現するためには,任意の話者の声,様々な発話スタイル,感情表現,強調等を自在に表現できる必要がある.統計的アプローチの利点は,このような多様な音声を,数学的に定義されたアルゴリズムによって比較的簡単に実現できることである.統計的アプローチの基本的な考え方について概観するとともに,最新の応用事例についてデモとともに紹介する.This talk will give an overview of statistical approach to flexible speech synthesis. For constructing human-like talking machines, speech synthesis systems are required to have an ability to generate speech with arbitrary speaker's voice, various speaking styles in different languages, varying emphasis and focus, and/or emotional expressions. The main advantage of the statistical approach is that such flexibility can easily be realized using mathematically well-defined algorithms. In this talk, the system architecture is outlined and then recent results and demos will be presented.AN10442647研究報告音声言語情報処理(SLP)2014-SLP-1046112014-12-082014-12-02