@techreport{oai:ipsj.ixsq.nii.ac.jp:00170565, author = {吉井, 和佳 and 中村, 栄太 and 糸山, 克寿 and 後藤, 真孝}, issue = {21}, month = {Jul}, note = {本稿では,音楽音響信号に対する音源分離のための主要な二つの行列分解技法である非負値行列因子分解 (nonnegative matrix factorization: NMF) と確率的潜在要素解析 (probabilistic latent component analysis: PLCA) について,対応する確率モデルの性質を明らかにし,比較検討を行う.NMF では,各フレームにおける混合音のスペクトルを,少数の基底スペクトルの重み付き和で近似する.すなわち,各フレームにおいて複数の音源が同時に生起することが許容されており,NMF は因子モデルの一種である.一方,PLCA では,時間・周波数平面上のスペクトログラムをヒストグラムであるとみなし,その背後にある確率分布を推定する.このとき,各時間・周波数ビンの振幅値を量子化し,仮想的な音粒子の観測個数であるとみなしたうえで,各粒子をいずれかの音源に排他的に割り当てるため,PLCA は混合モデルの一種である.これまで,NMF の方が物理的に自然な解釈ができるにもかかわらず,実際には PLCA も盛んに利用されており,理論・性能の両面で十分に調査がなされているとは言えなかった.本稿では,因子モデルである NMF に対してはガンマ過程あるいはベータ過程を,混合モデルである PLCA に対してはディリクレ過程を用いることにより,基底数を自動調節するためのノンパラメトリックベイズモデルを構成できることを示し,変分ベイズ法あるいはギブスサンプリングを用いた推論方法を導出する.また,音楽音響信号に対して音源分離を行い,期待通り動作することを確かめた.}, title = {NMF vs PLCA: 多重音生成過程のための無限因子モデルと無限混合モデル}, year = {2016} }