Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
双曲空間への音色埋め込みを用いたガウス混合変分自己符号化器による楽音合成の検討 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション4 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
産業技術総合研究所 |
著者所属 |
|
|
|
東京大学 |
著者所属(英) |
|
|
|
en |
|
|
the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
the University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Advanced Industrial Science and Technology (AIST) |
著者所属(英) |
|
|
|
en |
|
|
the University of Tokyo |
著者名 |
中島, 風太
中村, 友彦
高宗, 典玄
深山, 覚
猿渡, 洋
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,音色の階層性を考慮した変分自己符号化器(variational autoencoder: VAE)による楽音合成法を提案する.VAE に基づく楽音合成では,楽器音をその特徴を捉えた低次元な潜在空間に射影しそこから再構成できるよう学習する.潜在空間で効率的な表現を得るためには,データの性質を反映した潜在空間を構築することが重要である.これに対し,本稿では物理的な機構に基づく楽器分類体系には階層性が存在することに着眼し,音色に関する潜在変数を階層性のあるデータを効率的に表現できる双曲空間上で定義した VAE を提案する.提案法は,音色と音高を別々の潜在空間で扱うことのできる従来法を拡張し,音色に関する潜在変数の事前分布として双曲空間上の正規分布(擬似双曲正規分布)を導入する.また,擬似双曲正規分布の導入を行っても,従来法と同様に確率的勾配降下法を用いて学習できることを示す.実験により,音色に関する潜在空間において,Euclid 空間を用いる場合に比べ双曲空間を用いることで,同一楽器類はより近く,異種楽器類はより遠くへと埋め込まれることが示唆された. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-142,
号 62,
p. 1-8,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |