Item type |
SIG Technical Reports(1) |
公開日 |
2023-02-21 |
タイトル |
|
|
タイトル |
クラス事後確率に基づくミックスボイスを含めた声区情報の定量化 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Quantification of Voice Register Information including Mixed Voice based on Class Posterior Probabilities |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SP4:音声処理・評価 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学工学部 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
著者名 |
北村, 悠
菊地, 晏南
齋藤, 大輔
峯松, 信明
|
著者名(英) |
Yu, Kitamura
Anan, Kikuchi
Daisuke, Saito
Nobuaki, Minematsu
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
地声と裏声の識別手法などがこれまでに提案されているが,両者の中間的な発声と言われるミックスボイスを分析する研究は少ない.本研究では,地声,裏声,ミックスボイスの声区を対象として,既存の音響特徴量を用いて声区情報を定量化することを目的とする.定量化の方法として,音声を地声と裏声の 2 クラスに分類する識別器にミックスボイスを入力し,推定されるクラス事後確率を利用した.本稿では先行研究を踏まえ,地声と裏声の差異を表す特徴量として,基本周波数,第二倍音と基本波の振幅差,1 次のケプストラム係数,非周期性指標,歌声フォルマントを検討した.これらの特徴量から構成された地声と裏声の識別器の性能評価のため,交差検証を行った結果,単一母音単一歌唱者の場合,およそ 95 % 以上の正解率が得られた.この識別器にミックスボイスを入力し,声区情報の定量化を行った結果,SVM では地声と裏声の中間的な事後確率が得られ,地声らしさ,裏声らしさを定量化することができた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Methods to distinguish between modal and falsetto have been proposed so far, but there are few studies analyzing mixed voices, which are intermediate ones of them. This study aims to quantify vocal register information by using existing acoustic features for modal, falsetto and mixed voice. Class posterior probabilities were used to quantify it by inputting mixed voices to a discriminator that classifies voices into two classes, modal and falsetto. In this paper, fundemental frequency, amplitude defference between second harmonic and fundemental wave, the first cepstral coefficient, aperiodicity and singer’s formant were stated as features indicating difference between modal and falsetto. Cross-validation was performed to evaluate the performance of the discriminator between modal and falsetto composed of these features. As a result, the correct answer rate was about 95 % or higher in the case of single-vowel and single-singer. Mixed voices were input to this dicriminator. Posterior probabilities were intermediate between modal and falsetto in the case of SVM, and mixed voices were quantified between modal and falsetto. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2023-SLP-146,
号 76,
p. 1-6,
発行日 2023-02-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |