Item type |
SIG Technical Reports(1) |
公開日 |
2019-06-15 |
タイトル |
|
|
タイトル |
屋外拡声品質予測モデルの中間特徴量の検討 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション2 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
室蘭工業大学 |
著者所属 |
|
|
|
室蘭工業大学 |
著者所属 |
|
|
|
室蘭工業大学 |
著者所属 |
|
|
|
TOA株式会社 |
著者所属(英) |
|
|
|
en |
|
|
Muroran Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Muroran Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Muroran Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
TOA Corporation |
著者名 |
野口, 啓太
小林, 洋介
岸上, 順一
栗栖, 清浩
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
東日本大震災では,20% の市民が屋外拡声音をよく聴き取れなかった事が報告されている.このため,屋外拡声器の品質向上が議論されているが,聴取実験のコストがかかるなど解決すべき点は多い.我々はこれまでに,MFCC を音響特徴量として,主観評価指標である LDR (Listening difficulty rating) を予測する機械学習モデルを提案したが,教師となる主観評価数が少なく,RMSE (Root means squared error) が 0.20 と満足な性能が得られなかった.そこで本稿では,MFCC から中間特徴量となる客観評価値を予測するモデルと,中間特徴量から主観評価値を予測する 2 モデルの組み合わせを提案する.中間特徴量に用いる指標に,Short time objective intelligibility,Speech intelligibility prediction based on mutual information,Extended short time objective intelligibility の 3 指標を比較した.その結果,最適な中間特徴量は SNR により異なったものの,SNR が0 dB から 30 dB の範囲では以前の検討よりも良い,RMSE が 0.14 以下を達成した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2019-SLP-127,
号 53,
p. 1-4,
発行日 2019-06-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |