WEKO3
アイテム
ℓ2ノルム正則化TV-CAR分析を用いた音声の????0推定
https://ipsj.ixsq.nii.ac.jp/records/211598
https://ipsj.ixsq.nii.ac.jp/records/211598d0c2495d-bbc3-4bc8-88ea-3c20ea769624
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
SLP:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2021-06-11 | |||||||
タイトル | ||||||||
タイトル | ℓ2ノルム正則化TV-CAR分析を用いた音声の????0推定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | ????0 estimation of speech based on ℓ2-norm regularized TV-CAR analysis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般発表 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
琉球大学情報基盤統括センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IT Center, University of the Ryukyus | ||||||||
著者名 |
舟木, 慶一
× 舟木, 慶一
|
|||||||
著者名(英) |
Keiichi, Funaki
× Keiichi, Funaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 線形予測(Linear Predictive Coding:LPC)分析は,スマートフォンや Skype,LINE,ZOOM などに実装されている音声符号化などの音声処理において,最も成功をおさめている音声分析と言える.LPC は音声信号から低演算量で自己回帰 (AR) スペクトルを推定でき,その係数は LSP によるベクトル量子化 (VQ) により効率良く量子化できる.LPC の最も有用な利点は,逆フィルタにより残差信号を容易に算出できることである.これまでに,ARMA 分析,時変分析,複素分析,声帯音源推定など,様々な拡張がなされてきた.我々は,MMSE (Minimizing Means Square),ELS (Extended Least Square),LASSO などに基づく,解析信号から複素 AR パラメータを各サンプルで推定できる時変複素 AR(TV-CAR)音声分析を既に提案した.LASSO は,ℓ1 ノルム正則化法であり,多大な計算量が必要であるが,性能はそれほど高くない.本稿では,ℓ2 ノルム正則化 RLP,時間 RLP (TRLP),およびそれらのハイブリッド基準に基づく TV-CAR 分析を提案し,IRAPT による ????0 推定を用いてその性能を評価する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Linear Prediction (LP) is the most successful speech analysis in speech processing, including speech coding implemented on a smartphone, Skype, Line, ZOOM, or so on. The LP can estimate Auto-Regressive (AR) spectrum from speech signal with a small amount of computation, and its coefficients can be quantized by using Vector Quantization (VQ) with Line Spectrum Pair (LSP). The most vital point of the LP is to be able to estimate the residual signal easily using the inverse filter. Numerous improvements on the LP has been carried out, including ARMA analysis, time-varying analysis, complex analysis, glottal source estimation, or so on. We have already proposed time-varying complex AR (TV-CAR) speech analysis that can estimate complex AR parameters in any sample from an analytic signal based on MMSE (Minimizing Means Square), Extended Least Square (ELS), LASSO, or so on. The LASSO is an ℓ1-norm regularization method that requires massive computation with moderate performance. This paper proposed ℓ2-norm regularization based TV-CAR analysis, RLP, TRLP, and their hybrid method and evaluated the performance using ????0 estimation with the IRAPT. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2021-SLP-137, 号 23, p. 1-6, 発行日 2021-06-11 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8663 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |