Item type |
SIG Technical Reports(1) |
公開日 |
2024-02-22 |
タイトル |
|
|
タイトル |
複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SP2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
電気通信大学情報理工学研究科 |
著者所属 |
|
|
|
東京大学/電気通信大学情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学情報理工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo / Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics and Engineering, The University of Electro-Communications |
著者名 |
越森, 道貴
嵯峨山, 茂樹
中鹿, 亘
|
著者名(英) |
Michiki, Koshimori
Shigeki, Sagayama
Toru, Nakashika
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
LPC における変形相関法の原理を拡張し,短時間音声信号スペクトルから基本周波数と周期性尺度を推定するための手法としてラグ窓,ラグ窓対,複数ラグ窓対などの検討を行う.自己相関関数にラグ窓を弱く掛けて調波構造の谷の凹凸を潰す一方で,ラグ窓を強く掛けて調波構造を潰してスペクトル包絡を得て,両者の比を求めて逆フーリエ変換することで,????0 推定精度を向上する方法を検討する.また,推定対象となる音声の ????0 の分布が未知である場合のため,????0 候補の存在する帯域を分割して,複数のラグ窓対を用いる ????0 推定方法についても述べる.さらに,音声の周期性を数値化する尺度となる周期性尺度の求め方を提案する.音声データベースを用いた評価実験により,提案手法の ????0 推定性能,周期性尺度による有声無声判定性能の精度評価を行うことで,特に????0 の高い音声に対して高い推定精度やノイズに対する頑健性を示し,音声分析の分野における基本手法の一つとなり得る可能性を示した.周期性尺度を用いた有声無声判定は一部条件下において比較手法に匹敵する精度を示し,単一のラグ窓を用いたラグ窓法による有声無声判定は特に ????0 の高い音声に対して比較手法を上回る精度を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Extending the main concept of modified autocorrelation method in LPC, we investigate lag windows, lag window pairs, and multi-lag window pairs as methods for estimating the fundamental frequency and periodicity measure from short-time speech signal spectra. A lag window is weakly applied to the autocorrelation function to eliminate unevenness in the valleys of the harmonic structure, while a lag window is applied strongly to eliminate the harmonic structure to obtain a spectral envelope, and the ratio of the two is calculated and inverse Fourier transform is performed. We will consider ways to improve the ????0 estimation accuracy. In addition, since the distribution of ????0 of the speech to be estimated is unknown, we will also describe a ????0 estimation method that divides the band in which ????0 candidates exist and uses multiple lag window pairs. Furthermore, we propose a method to obtain a periodicity measure, which is a measure for quantifying the periodicity of speech. Through evaluation experiments using a speech database, we evaluated the ????0 estimation performance of the proposed method and the voiced/unvoiced decision performance using a periodicity measure. It demonstrated robustness and showed the possibility of becoming one of the basic methods in speech analysis. Voiced/unvoiced judgment using a periodicity measure shows accuracy comparable to the compared methods under some conditions, and voiced/unvoiced decision based on the lag window method using a single lag window is particularly effective for voices with high ????0. The accuracy exceeded that of the comparative methods. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2024-SLP-151,
号 29,
p. 1-6,
発行日 2024-02-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |