2024-03-29T19:22:22Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000803712024-03-29T05:26:34Z01164:05159:06679:06680
HMM歌声合成における音高正規化学習の検討HMM-based synthesis of singing voices using pitch adaptive trainingjpn歌声情報処理http://id.nii.ac.jp/1001/00080371/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=80371&item_no=1&attribute_id=1&file_no=1Copyright (c) 2012 by the Information Processing Society of Japan名古屋工業大学大学院工学研究科名古屋工業大学大学院工学研究科名古屋工業大学大学院工学研究科名古屋工業大学大学院工学研究科大浦, 圭一郎間瀬, 絢美南角, 吉彦徳田, 恵一隠れマルコフモデル (Hidden Markov Model; HMM) に基づく歌声合成システムは HMM テキスト音声合成システムを応用したシステムで,歌声から抽出したスペクトル,基本周波数,ビブラートを HMM でモデル化し,学習した HMM からパラメータを生成することで,任意の歌声が合成できる.しかし,HMM 歌声合成が合成可能な音高は学習データベースに強く依存するため,学習データベースの中に特定の音高が少ない場合や存在しない場合にその音高をうまく合成できない問題があった.この問題を軽減するため,音高をシフトさせたデータを用いて擬似的に学習データを増やす手法や,あらかじめデータを正規化する手法が提案されているが,疑似学習データによる学習時間の増大や,学習アルゴリズムとデータの不一致などの様々な問題があった.そこで本稿では,音符の音高を基準とした対数基本周波数系列の正規化を学習に内包する音高正規化学習手法を提案し,主観評価実験により提案手法の有効性を確認した.In Hidden Markov Model (HMM)-based singing voice synthesis approach, the spectrum, excitation, and vibrato of singing voices are simultaneously modeled with context-dependent HMMs and waveforms are generated from the HMMs themselves. HMM-based singing voice synthesis systems are heavily based on the training data in performance because these systems are “corpus-based.” Therefore, pitches hardly ever appear in the training data cannot be well-trained. A technique using pitch-shifted pseudo-data is one solution to this problem. However, there are various problems such as large computational costs. Although data-level pitch normalization has also been proposed, there are still some other problems such as the inconsistency between data and training. In this paper, we proposed “pitch adaptive training” which make it possible to normalize pitch based on musical notes in the training process. The experimental results demonstrated that the proposed technique could alleviate the data sparsness problem.AN10442647研究報告音声言語情報処理(SLP)2012-SLP-9015162012-01-272012-01-30