WEKO3
アイテム
Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換
https://ipsj.ixsq.nii.ac.jp/records/55977
https://ipsj.ixsq.nii.ac.jp/records/55977a1bbe7d5-c7f6-4d6c-b021-70409e5301e8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-08-03 | |||||||
タイトル | ||||||||
タイトル | Specmurtにおける凖最適共通調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Recursive Estimation of Quasi-Optimal Common Harmonic Structure Pattern for Specmurt Anasylis: Piano-Roll-Display Visiualization and MIDI Conversion of Polyphonic Music Signal | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学工学部 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Engineering, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者名 |
亀岡, 弘和
× 亀岡, 弘和
|
|||||||
著者名(英) |
Hirokazu, Kameoka
× Hirokazu, Kameoka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまで我々は,多声音楽信号の高調波周波数成分を抑圧低減して基本周波数のみを強調することでピアノロールに似た可視化を可能にする新しい信号処理方法"Specmurt法"を提案した.この手法は,多重音の各音が共通の音色(調波構造パターン)をもつと想定することで,観測多重音スペクトルと共通調波構造パターンとの逆畳み込みにより基本周波数成分だけを強調することができる.ただし,得られる可視化結果の精度は共通調波構造パターンの定め方に大きく依存するにも関わらず,これまでは人手で調節しながらパターンを設計する必要があった. 本報告では,基本周波数パターンのsigmoid関数による非線形変換ステップとLU分解によるパラメータ最適化ステップを繰り返すことで凖最適な共通調波構造パターンを推定する方法を提案する.これにより,人手による手間をかけずに鮮明な音高可視化表示が可能となることを実音楽信号を対象とした実験により確認した.また,得られた可視化結果をもとにMIDIフォーマットに変換することができ,70?80%の音高正解率を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have previously proposed a new signal processing technique, "specmurt anasylis," that suppresses harmonic components and provides piano-roll-like visual display of multi-tone signals (e.g., polyphonic music). "Specmurt" enhances fundamental components by deconvolution of the input multi-pitch spectrum and the common harmonic structure pattern in log-frequency domain. However, how intelligible the output display may be depends highly on the common harmonic structure pattern we determine. This had to be adjusted experimentally by trial and error. In this paper, we propose a method that automatically estimates the quasi-optimal common harmonic structure pattern by the iteration; nonlinear mapping of the fundamental frequency distribution using sigmoid function and the optimization of the parametric impulse train pattern using LU decomposition. We were able to visualize intelligible piano-roll-like displays of real music signal data without spending effort on the pattern adjustment. The resulted display was transformed into a MIDI format and the musical notes were recognized with an accuracy of 70縲鰀80%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
情報処理学会研究報告音楽情報科学(MUS) 巻 2004, 号 84(2004-MUS-056), p. 41-48, 発行日 2004-08-03 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |