@techreport{oai:ipsj.ixsq.nii.ac.jp:00190859, author = {和田, 雄介 and 錦見, 亮 and 中村, 栄太 and 糸山, 克寿 and 吉井, 和佳}, issue = {8}, month = {Aug}, note = {本稿では,音符系列 (楽譜) から,WaveNet と呼ばれる深層自己回帰モデルを用いて歌唱 F0 軌跡を生成する手法を示す.歌唱 F0 軌跡には,ビブラートやポルタメントなど,時間 ・ 周波数方向の複雑な変動が含まれる.従来は,このような変動を表現するのに隠れマルコフモデル (HMM) が用いられていたが,歌唱 F0 軌跡の複雑な変動を正確に捉えるためには,より表現力の高いモデルが必要である.この問題を解決するため,近年,深層自己回帰モデル WaveNet を用いて,楽譜と歌詞から歌唱 F0 軌跡を生成する手法が提案された.この手法を基に,本研究では,WaveNet の歌詞情報なしに歌唱 F0 軌跡を生成する能力を調査する.提案手法では,WaveNet による歌唱 F0 軌跡の生成を,音符系列および楽譜から抽出した特徴量によって条件付ける.また,オリジナルの WaveNet では学習時にクロスエントロピー誤差が用いられているが,生成される歌唱 F0 軌跡の自然さを高めるため,提案手法では,正解 F0 軌跡と予測との平均二乗誤差に比例する重みがついたクロスエントロピーを損失関数として用いる.実験の結果,楽譜から抽出した特徴量の追加および損失関数の変更が,どちらも生成された歌唱 F0 軌跡の品質向上に寄与することを示した.}, title = {WaveNetを用いた楽譜情報に基づく歌唱F0軌跡の生成}, year = {2018} }