WEKO3
アイテム
音声合成のための信号処理・統計モデル
https://ipsj.ixsq.nii.ac.jp/records/197863
https://ipsj.ixsq.nii.ac.jp/records/197863d43bb624-ac52-4dc9-8272-f4dc142a38b3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2019 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2019-06-15 | |||||||
タイトル | ||||||||
タイトル | 音声合成のための信号処理・統計モデル | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An overview of technology for speech synthesis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | チュートリアル講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ヤマハ株式会社 | ||||||||
著者名 |
才野, 慶二郎
× 才野, 慶二郎
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本チュートリアルでは,テキスト音声合成のタスクに用いられる主要な技術について概観する.テキスト音声合成タスクは典型的には (1) テキストから言語特徴量を得る,(2) 言語特徴量から音響特徴量を得る,(3) 音響特徴量から波形を得る,という 3 つの部分問題で構成される.中でも特に盛んに取り組まれているのが (2) と (3) である.(2) では,かつては音声素片を選択的に使用する単位選択型手法が主流であった一方で,近年は統計モデルを使用して尤もらしい音響特徴量を推論する統計的パラメトリック手法がよく用いられる.(3) ではボコーダと呼ばれる決定論的な信号処理手法が広く用いられるとともに,近年ではディープニューラルネットワークに直接波形を生成させる手法も用いられはじめている.また (1) と (2) を 1 つのモデルで一気に解くような End-to-end を指向した深層学習手法も近年提案され,注目を集めている. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2019-SLP-127, 号 10, p. 1-1, 発行日 2019-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8663 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |