@techreport{oai:ipsj.ixsq.nii.ac.jp:00238205, author = {田中, 啓太郎 and 吉井, 和佳 and Simon, Dixon and 森島, 繁生}, issue = {11}, month = {Aug}, note = {本稿では,単旋律音楽信号を時変音高成分(音高)と時不変音色成分(音色),および時変音色成分(変動)の三要素へと分解する手法について述べる.このような三要素分解には,変分オートエンコーダを用いた入力摂動に基づく手法が提案されており,楽器音に対する動作が確認されている.しかし,音高変化を伴う音楽信号や歌声信号に対しては,二つの時変成分間の分解が困難となる.本研究では,既存の入力摂動に基づく三要素変分オートエンコーダを重み共有して二度直列に適用する,反復再構成法を導入する.これにより,エンコーダの抽出対象となる成分が絞られるとともに,暗黙的なデータ増強が行われる.さらに,提案する直列モデルは単一の統合変分オートエンコーダとして再構築され,新たな確率的定式化を通した教師なし変分ベイズ学習も可能となる.実験では,反復再構成法により多様な音楽信号の三要素分解が可能であることを確認し,単旋律音楽信号に対する普遍的な潜在表現が獲得されることを示した.}, title = {変分オートエンコーダを用いた単旋律音楽信号の音高・音色・変動への分解}, year = {2024} }