ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2021
  4. 2021-SLP-137

ℓ2ノルム正則化TV-CAR分析を用いた音声の????0推定

https://ipsj.ixsq.nii.ac.jp/records/211598
https://ipsj.ixsq.nii.ac.jp/records/211598
d0c2495d-bbc3-4bc8-88ea-3c20ea769624
名前 / ファイル ライセンス アクション
IPSJ-SLP21137023.pdf IPSJ-SLP21137023.pdf (1.6 MB)
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2021-06-11
タイトル
タイトル ℓ2ノルム正則化TV-CAR分析を用いた音声の????0推定
タイトル
言語 en
タイトル ????0 estimation of speech based on ℓ2-norm regularized TV-CAR analysis
言語
言語 jpn
キーワード
主題Scheme Other
主題 一般発表
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
琉球大学情報基盤統括センター
著者所属(英)
en
IT Center, University of the Ryukyus
著者名 舟木, 慶一

× 舟木, 慶一

舟木, 慶一

Search repository
著者名(英) Keiichi, Funaki

× Keiichi, Funaki

en Keiichi, Funaki

Search repository
論文抄録
内容記述タイプ Other
内容記述 線形予測(Linear Predictive Coding:LPC)分析は,スマートフォンや Skype,LINE,ZOOM などに実装されている音声符号化などの音声処理において,最も成功をおさめている音声分析と言える.LPC は音声信号から低演算量で自己回帰 (AR) スペクトルを推定でき,その係数は LSP によるベクトル量子化 (VQ) により効率良く量子化できる.LPC の最も有用な利点は,逆フィルタにより残差信号を容易に算出できることである.これまでに,ARMA 分析,時変分析,複素分析,声帯音源推定など,様々な拡張がなされてきた.我々は,MMSE (Minimizing Means Square),ELS (Extended Least Square),LASSO などに基づく,解析信号から複素 AR パラメータを各サンプルで推定できる時変複素 AR(TV-CAR)音声分析を既に提案した.LASSO は,ℓ1 ノルム正則化法であり,多大な計算量が必要であるが,性能はそれほど高くない.本稿では,ℓ2 ノルム正則化 RLP,時間 RLP (TRLP),およびそれらのハイブリッド基準に基づく TV-CAR 分析を提案し,IRAPT による ????0 推定を用いてその性能を評価する.
論文抄録(英)
内容記述タイプ Other
内容記述 Linear Prediction (LP) is the most successful speech analysis in speech processing, including speech coding implemented on a smartphone, Skype, Line, ZOOM, or so on. The LP can estimate Auto-Regressive (AR) spectrum from speech signal with a small amount of computation, and its coefficients can be quantized by using Vector Quantization (VQ) with Line Spectrum Pair (LSP). The most vital point of the LP is to be able to estimate the residual signal easily using the inverse filter. Numerous improvements on the LP has been carried out, including ARMA analysis, time-varying analysis, complex analysis, glottal source estimation, or so on. We have already proposed time-varying complex AR (TV-CAR) speech analysis that can estimate complex AR parameters in any sample from an analytic signal based on MMSE (Minimizing Means Square), Extended Least Square (ELS), LASSO, or so on. The LASSO is an ℓ1-norm regularization method that requires massive computation with moderate performance. This paper proposed ℓ2-norm regularization based TV-CAR analysis, RLP, TRLP, and their hybrid method and evaluated the performance using ????0 estimation with the IRAPT.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2021-SLP-137, 号 23, p. 1-6, 発行日 2021-06-11
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 17:44:40.967224
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3