@techreport{oai:ipsj.ixsq.nii.ac.jp:00183039, author = {吉井, 和佳}, issue = {6}, month = {Aug}, note = {本稿では,モノラルの音響信号に対して音源分離を行うための究極の因子分解法について述べる.従来は,非負値行列分解 (NMF) を用いて,混合音の各時刻におけるパワースペクトルを,少数の基底スペクトルの線形和で近似することがよく行われてきた.近年では,複素スペクトルに含まれる位相情報を適切に取り扱うため,半正定値テンソル分解 (PSDTF) が提案されている.PSDTF は,NMF の本質的な拡張となっており,混合音の各時刻における複素スペクトルから計算される局所的な共分散行列を,少数の基底共分散行列の線形和で近似する.この方法により,複素スペクトログラムにおける周波数方向の相関を考慮することができるようになったが,依然として時間方向の独立性が仮定されていた.複素スペクトログラムの周波数軸と時間軸を入れ替えて PSDTF を利用することも可能であるが,時間方向の相関は考慮できても,周波数方向の独立性を仮定せざるを得なかった.この問題を解決するため,本研究では,周波数方向の相関と時間方向との相関を同時に取り扱うことができる相関テンソル分解 (CTF) を提案する.CTF は,PSDTF のさらなる拡張となっており,複素スペクトログラムを構成するすべての時間周波数ビン間の共分散行列を,周波数方向の共分散行列と時間方向の共分散行列とのクロネッカー積の和で近似する.この方法により,すべての時間周波数ビン間の相関を考慮したウィナーフィルタを用いて,音源信号の複素スペクトログラムを一挙に推定することが可能となる.CTF は,NMF や PSDTF と同様に EM アルゴリズムあるいは補助関数法を用いた最尤推定や,ガンマ過程に基づくノンパラメトリックベイズ拡張 (基底数の無限化) が可能である.実験の結果,高品質な音源分離ができることを確かめた.}, title = {モノラル音響信号に対する音源分離のための無限相関テンソル分解}, year = {2017} }