WEKO3
-
RootNode
アイテム
歌声GMMとビタビ探索を用いた多重奏中のボーカルバートに限定した基本周波数推定手法
https://ipsj.ixsq.nii.ac.jp/records/55779
https://ipsj.ixsq.nii.ac.jp/records/55779a76a0d53-a1d9-476f-af64-e47b2ee3a3cd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-08-02 | |||||||
タイトル | ||||||||
タイトル | 歌声GMMとビタビ探索を用いた多重奏中のボーカルバートに限定した基本周波数推定手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An FO estimation method for detecting vocal part in polyphonic music by using vocal GMM and Viterbi search | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Intelligence Science and Technology, Graduate School of Infomatics, Kyoto University | ||||||||
著者名 |
藤原弘将
後藤, 真孝
奥乃, 博
× 藤原弘将 後藤, 真孝 奥乃, 博
|
|||||||
著者名(英) |
HIROMASA, FUJIHARA
MASATAKA, GOTO
HIROSHI, G.OKUNO
× HIROMASA, FUJIHARA MASATAKA, GOTO HIROSHI, G.OKUNO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,混合音中のボーカルパートの基本周波数(F0)を推定する手法について述べる,ボーカルパートは多くのジャンルの音楽で主要な役割を果たしており,ボーカルパートのF0推定は様々な用途に応用出来る.我々は,確率的定式化により,ボーカルパートのF0推定の問題を多重ピッチ解析問題と音源(歌声かどうか)認識問題に帰着させる.音源認識問題は,歌声/非歌声を表現する混合ガウス分布(GMM)を用いて,歌声確率を計算することで実現する.最後に,これらの確率的問題を最大化するF0の系列をピタピアルゴリズムによって推定する.評価実験により,F0推定精度が75.4%から 78.3%に向上し,誤り率を13.8%削減することを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a method for estimating F0s of vocal part from polyphonic audio signals. Because melody is sung by a singer in many musical pieces, the estimation of F0s of the vocal part is useful for many applications. We separate the problem of estimating F0s of vocal into multiple-F0 estimation problem and sound source (vocal or not) recognition problem. To deal with the sound source recognition problem, we evaluate the vocal probability by using vocal and non-vocal Gaussian mixture models (GMMs), Finally, we estimate an F0 trajectory that maximize these stochastic problems, based on Viterbi search. Experimental results show that our method improves estimation accuracy from 75.4% to 78.3%, which is 13.8% reduction of misestimation. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
情報処理学会研究報告音楽情報科学(MUS) 巻 2007, 号 81(2007-MUS-071), p. 119-126, 発行日 2007-08-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |