2024-03-28T17:57:14Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001830502023-04-27T10:00:04Z01164:05064:09083:09227
調とリズムを考慮した階層隠れセミマルコフモデルに基づく歌声F0軌跡に対する音符推定jpn推定・認識http://id.nii.ac.jp/1001/00182962/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=183050&item_no=1&attribute_id=1&file_no=1Copyright (c) 2017 by the Information Processing Society of Japan京都大学大学院情報学研究科京都大学大学院情報学研究科産業技術総合研究所(AIST)京都大学大学院情報学研究科京都大学大学院情報学研究科/理化学研究所革新知能統合研究センター(AIP)錦見, 亮中村, 栄太後藤, 真孝糸山, 克寿吉井, 和佳本稿では歌声 F0 軌跡から音楽的に自然な音符系列を推定する統計的手法を示す.歌声の発音時刻や F0 は楽譜に示されたビート時刻や音符の音高からの大きな逸脱を含むため,歌声 F0 軌跡の時間 ・ 周波数方向への離散化による音符推定の精度を向上するためには,楽譜の音楽的な自然さを表現する楽譜モデルが重要である.我々は調とリズムに依存する音符の音高を表現する楽譜モデルと楽譜 (音符系列) から時間 ・ 周波数方向に逸脱する歌声 F0 軌跡を表現する F0 モデルとを統合した準ビート同期階層隠れセミマルコフモデル (HHSMM : hierarchical hidden semi - Markov model) を提案する.楽譜モデルでは,確率的に生成された調に従って音符の音高が生成される.さらに,音符の開始位置はビートの 1 次元格子上に定義されたマルコフ過程に従って生成される.F0 モデルでは,歌声の発音時刻の時間方向の逸脱,音符間における F0 の滑らかな遷移,F0 の周波数方向の逸脱が確率的に生成され,楽譜に付与される.提案法では,楽譜モデルと F0 モデルが音符推定に与える影響を考慮しながら,入力の歌声F0軌跡から尤もらしい音符系列を推定する.実験結果から調やリズムを考慮しない場合と比較して,提案法による音符系列の推定精度が向上することを示した.AN10438388研究報告音楽情報科学(MUS)2017-MUS-11617182017-08-172188-87522017-08-15