Item type |
SIG Technical Reports(1) |
公開日 |
2016-07-23 |
タイトル |
|
|
タイトル |
deepGTTM-II: ディープラーニングに基づく拍節構造分析器 |
タイトル |
|
|
言語 |
en |
|
タイトル |
deepGTTM-II: Metrical Structure Analyzer based on Deep Learning Technique |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
オーガナイズドセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
公立はこだて未来大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Future University Hakodate |
著者所属(英) |
|
|
|
en |
|
|
JAIST |
著者名 |
浜中, 雅俊
平田, 圭二
東条, 敏
|
著者名(英) |
Masatoshi, Hamanaka
Keiji, Hirata
Satoshi, Tojo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,音楽理論 Generative Theory of Tonal Music (GTTM) の拍節構造分析を自動で獲得する分析器について述べる.これまで自動で拍節構造を分析するシステムも構築されているが,分析誤りが多く,音楽家による修正が必須であったためディープラーニングに基づく新たな分析器を構築する.音楽家が GTTM に基づき拍節構造を分析した 300 曲の分析データベースを我々は保有しているが,それだけでは学習データが不足なため楽譜と拍節構造の関係を直接学習することは困難である.そこで我々は,楽譜と拍節構造との関係を以下の 3 つのステップでマルチタスク学習するシステム deepGTTM-II を提案する.まず,1 万 5 千件の教師なし楽曲データを用いてネットワークのプレトレーニングを行う.次に,GTTM ルールの適用箇所を 1 万 5 千件の教師なし楽曲に我々がこれまでに構築した自動分析器を用いて自動でラベル付けした自動教師つき楽曲データを作成し,バックプロパゲーションにより教師付き学習を行う.最後に,300 曲の教師付きデータを用いてファインチューニングを行う.実験の結果,deepGTTM-II は,従来の GTTM 分析器と比べて高い性能であることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper describes an analyzer that automatically generates the metrical structure of a generative theory of tonal music (GTTM). Although a fully automatic time-span tree analyzer has been developed, musicologists have to correct the errors in the metrical structure. In light of this, we use a deep learning technique for generating the metrical structure of a GTTM. Because we only have 300 pieces of music with the metrical structure analyzed by musicologist, directly learning the relationship between the score and metrical structure is difficult due to the lack of training data. To solve this problem, we propose a multidimensional multitask learning analyzer called deepGTM-II that can learn the relationship between score and metrical structures in the following three steps. First, we conduct unsupervised pre-training of a network using 15,000 pieces in a non-labeled dataset. After pre-training, the network involves supervised fine-tuning by back propagation from output to input layers using a automatic labeled dataset, which consists of 15,000 pieces labeled with an automatic analyzer that we previously constructed. Finally, the network involves supervised fine-tuning using a labeled dataset. The experimental results demonstrated that the deepGTTM-II outperformed the previous analyzers for a GTTM in F-measure for generating the metrical structure. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2016-MUS-112,
号 5,
p. 1-8,
発行日 2016-07-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |