@techreport{oai:ipsj.ixsq.nii.ac.jp:00220097,
 author = {中野, 倫靖 and 後藤, 真孝},
 issue = {8},
 month = {Sep},
 note = {本稿では,音楽音響信号と,そこから複数の既存の音楽音源分離(MDX)モデルによって分離された音源信号とを,時間変化する重みで混合してより高い分離性能を達成するシステム MDX-Mixer を提案する.従来,歌声分離や音楽音源分離において,時不変もしくは時変な正の混合重みによって,分離信号を混合する研究があった.これらに対して本研究では,分離された音源信号に加えて,分離前の音楽音響信号も活用した時変な混合を行う.時変重みは,音楽音響信号及びその分離信号を短いセグメントに分割してモデル化して推定し,音楽音響信号を考慮するために負の重みも許容する.本稿では,1x1 convolution を用いて時不変重みを推定する比較モデルと,コンピュータービジョン分野で提案されている MLP-Mixerレイヤーをセグメント毎に適用して時変重みを推定する MDX-Mixer の二種類を新たに提案し,MUSDB18-HQ データセットを用いて,音源対歪み比 (SDR) に基づいて評価する.その結果,MDX-Mixer は,混合に用いた最先端の MDX モデルよりも高い SDR を達成することを示す.},
 title = {MDX-Mixer: 複数の音楽音源分離モデルによる出力波形を時変混合するシステム},
 year = {2022}
}