Item type |
SIG Technical Reports(1) |
公開日 |
2016-07-23 |
タイトル |
|
|
タイトル |
NMF vs PLCA: 多重音生成過程のための無限因子モデルと無限混合モデル |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声合成・音楽生成モデル |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
京都大学大学院情報学研究科知能情報学専攻 |
著者所属 |
|
|
|
京都大学大学院情報学研究科知能情報学専攻 |
著者所属 |
|
|
|
京都大学大学院情報学研究科知能情報学専攻 |
著者所属 |
|
|
|
産業技術総合研究所情報技術研究部門 |
著者名 |
吉井, 和佳
中村, 栄太
糸山, 克寿
後藤, 真孝
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,音楽音響信号に対する音源分離のための主要な二つの行列分解技法である非負値行列因子分解 (nonnegative matrix factorization: NMF) と確率的潜在要素解析 (probabilistic latent component analysis: PLCA) について,対応する確率モデルの性質を明らかにし,比較検討を行う.NMF では,各フレームにおける混合音のスペクトルを,少数の基底スペクトルの重み付き和で近似する.すなわち,各フレームにおいて複数の音源が同時に生起することが許容されており,NMF は因子モデルの一種である.一方,PLCA では,時間・周波数平面上のスペクトログラムをヒストグラムであるとみなし,その背後にある確率分布を推定する.このとき,各時間・周波数ビンの振幅値を量子化し,仮想的な音粒子の観測個数であるとみなしたうえで,各粒子をいずれかの音源に排他的に割り当てるため,PLCA は混合モデルの一種である.これまで,NMF の方が物理的に自然な解釈ができるにもかかわらず,実際には PLCA も盛んに利用されており,理論・性能の両面で十分に調査がなされているとは言えなかった.本稿では,因子モデルである NMF に対してはガンマ過程あるいはベータ過程を,混合モデルである PLCA に対してはディリクレ過程を用いることにより,基底数を自動調節するためのノンパラメトリックベイズモデルを構成できることを示し,変分ベイズ法あるいはギブスサンプリングを用いた推論方法を導出する.また,音楽音響信号に対して音源分離を行い,期待通り動作することを確かめた. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2016-MUS-112,
号 21,
p. 1-10,
発行日 2016-07-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |