@techreport{oai:ipsj.ixsq.nii.ac.jp:00206382, author = {柴田, 剛 and 錦見, 亮 and 中村, 栄太 and 吉井, 和佳}, issue = {10}, month = {Aug}, note = {音楽構造解析では,セクションの境界推定と各セクションに対するイントロ・Aメロ・Bメロ・サビなどのラベル付けを行う.本稿では,LSTM-HSMM ハイブリッドモデルに基づくポピュラー音楽に対する構造解析手法を提案する.本モデルはセグメンテーション・クラスタリングを行う階層 HSMM(隠れセミマルコフモデル)とラベリングを行う LSTM ネットワークの統合モデルであり,クロマ特徴量・MFCC・メルスペクトルの生成過程を表す.セクション系列とクロマ特徴量・MFCC の生成確率は入力の音響特徴量から学習することで,音楽セクションの持つ重要な性質である同質性・反復性・規則性を明示的に表現する.LSTM ネットワークはセクションラベルに対するメルスペクトルの生成確率を記述し,事前学習を行うことで各セクションラベルの一般的な特徴を捉える.最終的にビタビ復号により最尤のセクションラベル系列を推定する.実験により提案手法の有効性を検証する.}, title = {LSTM-HSMMハイブリッドモデルに基づく音楽構造解析}, year = {2020} }