Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
Gammachirp Envelope Similarity Index (GESI) による模擬難聴音声の了解度予測- 防音室実験とクラウドソーシング遠隔実験の主観評価データを用いて - |
タイトル |
|
|
言語 |
en |
|
タイトル |
Speech intelligibility prediction of simulated hearing loss sounds using the Gammachirp Envelope Similarity Index (GESI)-Subjective data from laboratory and crowdsourced remote experiments- |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション3 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
和歌山大学システム工学部 |
著者所属 |
|
|
|
和歌山大学システム工学部 |
著者所属 |
|
|
|
和歌山大学システム工学部 |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Sytems Engineering, Wakayama University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Sytems Engineering, Wakayama University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Sytems Engineering, Wakayama University |
著者名 |
入野, 俊夫
田丸, 萌夏
山本, 絢子
|
著者名(英) |
Toshio, Irino
Honoka, Tamaru
Ayako, Yamamoto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
高齢難聴者個人ごとの音声了解度を予測できる客観評価指標を開発することを目標としている.本報告では,新しい客観評価指標 Gammachirp Envelope Similarity Index (GESI) を提案した.基準音声と評価音声を,ガンマチャープ聴覚フィルタバンク (GCFB) と変調周波数フィルタバンク (MFB) の組み合わせで分析し,特徴量間の拡張コサイン類似度を計算して統合した指標である.基準音声と評価音声の間の音圧レベル差や,聴取環境における閾値上レベルを適切に反映できるようにした.防音室とクラウドソーシングを用いた音声了解度主観評価実験結果を説明できるかを評価した.この実験は,模擬難聴システム WHIS を用いたもので,元音声,-20 dB 音圧低減処理音声,70 歳と 80 歳の難聴模擬音声の主観評価である.防音室実験とクラウドソーシング遠隔実験で,全く同じ音声提示にもかかわらず音圧低減処理音声の了解度が大きく異なった.GESI はこの相違まで精度良く予測できた.一方,従来法の STOI や ESTOI は,音圧正規化処理のため全く予測できなかった.HASPI は遠隔実験の結果を予測できなかった. GESI は,聴力レベルを導入した上で閾値上レベルを考慮することにより,難聴者個別の音声了解度を客観評価できる可能性がある. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We aim at developing an objective intelligibility measure (OIM) to predict speech intelligibility (SI) for individual elderly hearing impaired (HI) listeners. We proposed a new OIM called Gammachirp Envelope Similarity Index (GESI) which consisted of the gammachirp filterbank (GCFB), a modulation filterbank (MFB), and an extended cosine similarity metric. The level difference between the reference and test sounds were took into account for the SI prediction unlike many conventional OIMs such as STOI and ESTOI. SI experiments were performed in laboratory and crowdsourced remote environments to clarify the effects of peripheral dysfunction. Noisy speech sounds were processed to simulate the average HL of 70- and 80-year-olds using Wadai Hearing Impairment Simulator (WHIS). They were presented together with the unprocessed sounds and -20 dB level reduced sounds. The results showed that the difference between the unprocessed and -20 dB was much greater in the remote experiments than in the laboratory ones although the same stimuli were used. GESI consistently predicted the results in the both experiments very well. STOI and ESTOI completely failed to predict the both results. HASPI failed to predict the remote results. GESI has the potential to explain the SI of individual HI listeners when setting the hearing level and controlling the parameters corresponding to the sound level above the threshold. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2022-MUS-134,
号 49,
p. 1-6,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |