WEKO3
アイテム
TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討
https://ipsj.ixsq.nii.ac.jp/records/56602
https://ipsj.ixsq.nii.ac.jp/records/566026e5909c1-ccc1-4513-8361-c11e64823a0b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-12-02 | |||||||
タイトル | ||||||||
タイトル | TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Parameter optimization for a fundamental frequency extractor based on TANDEM-STRAIGHT | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
和歌山大学システムエ学部 | ||||||||
著者所属 | ||||||||
関西学院大学理工学部 | ||||||||
著者所属 | ||||||||
和歌山大学システムエ学部 | ||||||||
著者所属 | ||||||||
和歌山大学システムエ学部 | ||||||||
著者所属 | ||||||||
和歌山大学システムエ学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kwansei Gakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Wakayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Wakayama University | ||||||||
著者名 |
板垣, 英恵
× 板垣, 英恵
|
|||||||
著者名(英) |
Hanae, Itagakl
× Hanae, Itagakl
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 分析位置に依存しない周期信号のパワースペクトル推定法である TANDEM と、それに基づくスペクトル包絡の推定法 STRAIGHT とを組み合わせた、基本周波数抽出法が提案されている。本資料では、この TANDEM-S TRAIGHT に基づく基本周波数抽出法に含まれている設計パラメタの役割と抽出器の性能との関係を調べ、それらの最適化を試みた。取上げた設計パラメタは、周波数軸上での周期性の評価に用いる調波の個数と、それぞれ異なった基本周波数に特化した複数の基本周波数抽出器を統合する際の、それぞれの抽出器の守備範囲を定める重み関数の幅である。まず、それぞれのパラメタがどのように抽出性能に影響するかを説明した後、 EGG 信号を同時記録した音声データベースを用いて、パラメタの値と抽出器の性能との関係を定量的に評価した。その結果、 Grosserror を評価指標とした場合の最適値として、調波の個数は 3 ,重み関数の幅は、特化した基本周波数の 1/1.2 が採用された。これらの最適値を用いた場合の性能は、これまでの STRAIGHT [7] の基本周波数抽出器、および広く引用されている YIN と比較しても、遜色ないことが確認された。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A fundamental frequency extractor based on a temporally stable power spectral representation for periodic signals (TANDEM spectrum) and a spectral envelope derived from the representation (STRAIGHT spectrum) is proposed. This article describes roles of system parameters of the proposed method and their effects on system performance and reports results of preliminary optimization of them. System parameters investigated are; number of harmonic component for detecting hypothesized periodicity peak and weighting width on the log-lag domain for integrating specialized individual F0 detectors. Detailed descriptions of these parameters and their impact on F0 extraction performance are presented and they were further investigated using a database consisting of simultaneous recording of speech and EGG (electroglottogram) signals. Test results indicated that the proposed method has comparable performance with F0 extractors used in STRAIGHT and other popular F0 extractors such as YIN, when three harmonic components are used and weighting with a width of 1/√2 of the center lag is used. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2008, 号 123(2008-SLP-074), p. 155-160, 発行日 2008-12-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |