WEKO3
アイテム
隠れマルコフモデルに基づいた歌声合成システム
https://ipsj.ixsq.nii.ac.jp/records/56053
https://ipsj.ixsq.nii.ac.jp/records/56053054fdfe0-f7ca-42ba-803b-3dae7f01e392
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-08-04 | |||||||
タイトル | ||||||||
タイトル | 隠れマルコフモデルに基づいた歌声合成システム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Singing Voice Synthesis System Based on Hidden Markov Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋工業大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋工業大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋工業大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋工業大学 学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engieering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engieering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engieering, Nagoya Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science and Engieering, Nagoya Institute of Technology | ||||||||
著者名 |
酒向慎司
× 酒向慎司
|
|||||||
著者名(英) |
Shinji, Sako
× Shinji, Sako
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 隠れマルコフモデルに基づく音声合成方式を歌声合成に拡張することにより構築した歌声合成システムについて述べる.本システムでは,歌い手の声の質と基本周波数パターンに関する特徴をモデル化するため,スペクトルと基本周波数パターンをHMMにより同時にモデル化している.特に,自然な歌声を合成する上で重要な要素となる音符の音階や音長の基本周波数パターンへの影響を精度良くモデル化するため,楽譜から得られる音階と音長を考慮したコンテキスト依存モデルを構築している.これらのモデルに対して決定木によるコンテキストクラスタリング行うことで,未知の楽曲からの歌声合成が可能となっている.実験から,歌い手の特徴を再現し,なめらかで自然性の高い歌声の合成が可能であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We describe a singing voice synthesis system by applying HMM-based speech synthesis technique.In this system, a sequence of spectrum and F0 are modeled simultaneously in a unified framework of HMM, and context dependent HMMs are constructed by taking account of contextual factors that affects singing voice. In addition, the distributions for spectral and F0 parameter are clustered independently by using a decision-tree based context clustering technique. Synthetic singing voice is generated from HMMs themselves by using parameter generation algorithm. In the experiments, we confirmed that smooth and natural-sounding singing voice is synthesised. It is also maintains the characteristics and personality of the donor of the singing voice data for HMM training. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
情報処理学会研究報告音楽情報科学(MUS) 巻 2003, 号 82(2003-MUS-051), p. 77-82, 発行日 2003-08-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |