| Item type |
SIG Technical Reports(1) |
| 公開日 |
2020-08-17 |
| タイトル |
|
|
タイトル |
LSTM-HSMMハイブリッドモデルに基づく音楽構造解析 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音楽音響信号解析 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者所属 |
|
|
|
京都大学大学院情報学研究科 |
| 著者名 |
柴田, 剛
錦見, 亮
中村, 栄太
吉井, 和佳
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
音楽構造解析では,セクションの境界推定と各セクションに対するイントロ・Aメロ・Bメロ・サビなどのラベル付けを行う.本稿では,LSTM-HSMM ハイブリッドモデルに基づくポピュラー音楽に対する構造解析手法を提案する.本モデルはセグメンテーション・クラスタリングを行う階層 HSMM(隠れセミマルコフモデル)とラベリングを行う LSTM ネットワークの統合モデルであり,クロマ特徴量・MFCC・メルスペクトルの生成過程を表す.セクション系列とクロマ特徴量・MFCC の生成確率は入力の音響特徴量から学習することで,音楽セクションの持つ重要な性質である同質性・反復性・規則性を明示的に表現する.LSTM ネットワークはセクションラベルに対するメルスペクトルの生成確率を記述し,事前学習を行うことで各セクションラベルの一般的な特徴を捉える.最終的にビタビ復号により最尤のセクションラベル系列を推定する.実験により提案手法の有効性を検証する. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
| 書誌情報 |
研究報告音楽情報科学(MUS)
巻 2020-MUS-128,
号 10,
p. 1-8,
発行日 2020-08-17
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |