Item type |
SIG Technical Reports(1) |
公開日 |
2019-08-20 |
タイトル |
|
|
タイトル |
Attention-based LSTMを用いたクラシック楽曲の時代識別 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Attention-based LSTM for Period Identification of Classical Music |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
筑波大学大学院図書館情報メディア研究科 |
著者所属 |
|
|
|
筑波大学大学院図書館情報メディア研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Library, Information and Media Studies, University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Library, Information and Media Studies, University of Tsukuba |
著者名 |
森山, 治紀
平賀, 譲
|
著者名(英) |
Haruki, Moriyama
Yuzuru, Hiraga
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
クラシック音楽では,バロック ・古典派 ・ロマン派といった時代区分があるように,楽曲が書かれた時代によって書法に違いがみられる.従来の音楽理論がそれらの違いについて定性的な説明を行う一方で,音楽情報処理では,時代や作曲家ごとの音楽的特徴を定量的に取り扱う研究が行われている.本研究では,時代ごとの音楽的特徴を定量的に表現する手法として,和音系列から楽曲の時代区分を識別するニューラルネットワークモデルを提案する.本研究で提案する手法は,次の 2 つのプロセスからなる.(1) word2vec による単音の分散表現の獲得.(2) Attention 機構を導入した Long Short-Term Memory (LSTM) による識別モデルの構築.(2) の識別モデルの入力として,(1) で得られた分散表現を用いる.(1) については,獲得したベクトルを t-Distributed Stochastic Neighbor Embedding (t-SNE) を用いて二次元に圧縮すると,同じピッチクラスの音がクラスタを形成し,調の構成音と非構成音が分離し,さらに構成音 は 3 度間隔で環状に並ぶことが確認された.(2) については,クラシック音楽の作曲家 13 人の楽曲 2,396 曲を対象に,バロック ・古典派 ・ロマン派の 3 クラス分類を行なった結果,モデルの識別精度は約 76% であった.以上より,本研究で提案する手法は,時代による音楽的特徴の違いを定量的に扱う方法として有用であると考えられる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Classical music is divided into such eras as Baroque, Classical, and Romantic periods, each of which has its characteristic style. While traditional music theory qualitatively analyzes such peculiarities, the quantitative difference among periods or composers are studied in music information retrieval. Aiming for quantitative analysis, this paper proposes a neural network that classifies a series of chords according to when it was inferred to be written. The proposed model is comprised of two stages: generation of distributed representations of chord tones using word2vec and chord sequence classification with Attention-based Long Short-Term Memory (LSTM). The distributed representations are employed as the input to the LSTM classifier. Some musicologically reasonable phenomena were confirmed in the obtained word2vec vector space visualized in 2-D with t-Distributed Stochastic Neighbor Embedding (t-SNE). For example, notes belonging to the same pitch class were gathered into a cluster, scale notes and non-scale notes were separated, and the scale notes formed a cyclic form of diatonic third intervals. The LSTM classifier achieved 76% accuracy in 3-class (Baroque/Classical/Romantic) classification where 2,396 works of 13 classical music composers were used. The results showed the capability of the model to capture the stylistic difference among periods quantitatively. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2019-MUS-124,
号 7,
p. 1-6,
発行日 2019-08-20
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |