WEKO3
アイテム
複数の音程特徴量によるハミング入力楽曲検索システムの高精度化
https://ipsj.ixsq.nii.ac.jp/records/55695
https://ipsj.ixsq.nii.ac.jp/records/5569514624ca5-b636-4017-ac75-6c97a405555c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-02-08 | |||||||
タイトル | ||||||||
タイトル | 複数の音程特徴量によるハミング入力楽曲検索システムの高精度化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improvement of a Query-by-Humming Music Information Retrieval System using Multiple Musical Interval Features | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者名 |
市川, 拓人
× 市川, 拓人
|
|||||||
著者名(英) |
Takuto, Ichikawa
× Takuto, Ichikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,基本周波数(F0)の抽出を行わないハミング入力楽曲検索システムについて検討する.F0の抽出は,どれほど高精度なものでも抽出誤りを避けることが完全にはできず,検索精度を低下させる原因となっている.また,F0の抽出は適切に抽出されても,歌唱者の音高自体が誤っていることで,検索性能が低下するという問題も存在する.これらの問題に対し我々は以前,2つの対数周波数領域パワースペクトルの相互相関関数を音程特徴量として提案し,F0の代わりに音程特徴量,さらには音程特徴量の確率モデルを用いたハミング検索システムを構築した.検索実験の結果,提案手法を用いることで検索システムが高精度化することが確かめられた.本稿では前述の相互相関関数のピーク音程を音程特徴量として抽出し,検索システムの性能をさらに向上させることを検討する.また,以前に提案した音程特徴量,今回提案する音程特徴量それぞれを用いた時の検索結果を統合することで,それぞれの検索誤りを補正することを検討する.そして実際に検索実験により提案手法を導入した検索システムは,F0を用いた時の検索精度を13.2%回る結果となった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a query-by-humming (QbH) music information retrieval (MIR) system without F0 extraction. In F0 extraction based system, F0 extraction errors inevitably occur that degrades performance of the system. Furthermore, errors in pitch of sung data degrade performance of the system, too. To improve these problems, we have propose an MIR system that used a musical interval feature and probabilistic models. The performance of the proposed system exceeded the system based F0 extraction. In this paper, we use peak interval of the cross-correlation function as a tonal feature to improve performance of the system. In addition, we integrated multiple retrieval result to obtain better recognition result. From an experimented result, the top retrieval accuracy given by the proposed method have exceeded the system based F0 extraction by 13.2%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
情報処理学会研究報告音楽情報科学(MUS) 巻 2008, 号 12(2008-MUS-074), p. 7-12, 発行日 2008-02-08 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |