Item type |
SIG Technical Reports(1) |
公開日 |
2024-02-22 |
タイトル |
|
|
タイトル |
潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現名 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Speech representation based on VAE assuming gamma distribution for latent variables and observation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション2 SP/SLP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
電気通信大学 |
著者所属 |
|
|
|
電気通信大学 |
著者所属(英) |
|
|
|
en |
|
|
The University of Electro-communications |
著者所属(英) |
|
|
|
en |
|
|
The University of Electro-communications |
著者名 |
今市, 夏菜子
中鹿, 亘
|
著者名(英) |
Nanako, Imaichi
Toru, Nakashika
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,データの生成において複雑な関係を表現できる深層生成モデルが注目されており,その例として変分オートエンコーダ (Variational Auto Encorder:VAE) が挙げられる.通常 VAE は,エンコーダとデコーダともにガウス分布を仮定することが多いが,VAE の入力特徴量として適している振幅スペクトルは必ず正の値となることから,負の値も考慮するガウス分布は適切ではないと考えられる.そこで,正の値のみを考慮する確率分布の一つであるガンマ分布を仮定し再構成の精度の比較実験を行った.その結果,ガンマ分布を仮定した VAE において通常の VAE よりも良い精度の結果を得ることができ,VAE を用いて振幅スペクトルをモデル化するという点においてはガンマ分布が適していることが分かった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, deep generative models that can represent complex relationships in data generation have been attracting attention, and VAE is an example of such a model. However, since the amplitude spectrum suitable for VAE input features is always positive, a Gaussian distribution that also takes negative values into account is not appropriate. Therefore, we conducted an experiment to compare the accuracy of reconstruction by assuming a gamma distribution, a probability distribution that considers only positive values. As a result, we found that the VAE assuming the gamma distribution gave better accuracy results than the normal VAE, indicating that the gamma distribution is suitable for modeling amplitude spectra using VAE. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2024-SLP-151,
号 58,
p. 1-6,
発行日 2024-02-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |