2024-03-29T23:26:03Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000566752024-03-29T05:26:34Z01164:05159:05162:05167
テンポの変化による影響を考慮した歌唱音声合成に関する検討Singing Voice Synthesis Taking Account of Tempo Effectjpnhttp://id.nii.ac.jp/1001/00056675/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=56675&item_no=1&attribute_id=1&file_no=1Copyright (c) 2008 by the Information Processing Society of Japan名城大学大学院理工学研究科名城大学大学院理工学研究科名城大学大学院理工学研究科川添, 正人坂野, 秀樹板倉, 文忠子音を含む歌唱音声合成の品質を向上させる方法について検討している.実際の歌唱音声を収録して観察した結果,楽曲のテンポが速くなるにつれ,スペクトルの変動が小さくなる現象があることが明らかとなった.これは,声道の形状が急に変化できないことに起因すると考えられる.既存の歌唱音声合成手法では,このことがあまり考慮されておらず,これが合成音が不自然となる原因の1つとなっている.そこで,本稿では,発声タイミングから推定したスペクトル変動の減少量を表す尺度を用い,線形予測分析により推定された声道断面積関数に対して時間軸に関する平滑化を行うことで,実際の音声を模擬する方法を提案する.これにより,実際の音声のテンポによるスペクトル変動特性の変化を良く近似できることが分かった.This paper describes a method to improve quality of singing voice synthesis system including consonants. Analysis of recorded signal of real singing voice including consonants indicated that a faster tempo reduces the spectral variance of singing voice, because the vocal tract shape can only change at a limited speed. Since conventional synthesis systems do not take the spectral variance reduction into account, degradation of the synthetic singing voice is caused. We have developed a new measure representing the spectral variance reduction, that is estimated from note-on events of the MIDI signal. Spectral smoothing based on this measure in the domain of the vocal tract area function with respect to time is then applied to the conventional synthesis system. It is found that a generated singing voice by the proposed method successfully simulates the spectral variance reduction of real singing voice.AN10442647情報処理学会研究報告音声言語情報処理(SLP)200812(2008-SLP-070)45502008-02-082009-06-30