2024-03-29T06:46:13Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:002184542023-04-27T10:00:04Z01164:05064:10822:10948
双曲空間への音色埋め込みを用いたガウス混合変分自己符号化器による楽音合成の検討jpnポスターセッション4http://id.nii.ac.jp/1001/00218346/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=218454&item_no=1&attribute_id=1&file_no=1Copyright (c) 2022 by the Information Processing Society of Japan東京大学東京大学東京大学産業技術総合研究所東京大学中島, 風太中村, 友彦高宗, 典玄深山, 覚猿渡, 洋本稿では,音色の階層性を考慮した変分自己符号化器(variational autoencoder: VAE)による楽音合成法を提案する.VAE に基づく楽音合成では,楽器音をその特徴を捉えた低次元な潜在空間に射影しそこから再構成できるよう学習する.潜在空間で効率的な表現を得るためには,データの性質を反映した潜在空間を構築することが重要である.これに対し,本稿では物理的な機構に基づく楽器分類体系には階層性が存在することに着眼し,音色に関する潜在変数を階層性のあるデータを効率的に表現できる双曲空間上で定義した VAE を提案する.提案法は,音色と音高を別々の潜在空間で扱うことのできる従来法を拡張し,音色に関する潜在変数の事前分布として双曲空間上の正規分布(擬似双曲正規分布)を導入する.また,擬似双曲正規分布の導入を行っても,従来法と同様に確率的勾配降下法を用いて学習できることを示す.実験により,音色に関する潜在空間において,Euclid 空間を用いる場合に比べ双曲空間を用いることで,同一楽器類はより近く,異種楽器類はより遠くへと埋め込まれることが示唆された.AN10438388研究報告音楽情報科学(MUS)2022-MUS-13462182022-06-102188-87522022-06-09