| Item type |
SIG Technical Reports(1) |
| 公開日 |
2017-12-14 |
| タイトル |
|
|
タイトル |
[ポスター講演]DNN適応に基づく非可聴つぶやき認識用話者・環境依存音響モデルの構築 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
[Poster Session] Development of Speaker/Environment-Dependent Acoustic Model for Non-Audible Murmur Recognition Based on DNN Adaptation |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
名古屋大学 |
| 著者所属 |
|
|
|
名古屋大学 |
| 著者所属 |
|
|
|
名古屋大学 |
| 著者所属 |
|
|
|
名古屋大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya University |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya University |
| 著者名 |
野田, 聖太
林, 知樹
戸田, 智基
武田, 一哉
|
| 著者名(英) |
Seita, Noda
Tomoki, Hayashi
Tomoki, Toda
Kazuya, Takeda
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,サイレント音声インタフェースの実現に向けて,実環境下における非可聴つぶやき (Non-Audible Murmur : NAM) 認識の性能改善に取り組む.深層学習による音響モデルを NAM 認識に導入するとともに,話者適応学習による NAM 認識用話者依存音響モデルを構築する. また,雑音環境下における NAM 認識性能を改善するために,雑音重畳 NAM データを用いて雑音依存音響モデルを構築する.構築した音響モデルの有効性を調査するため,静寂環境下ならびに雑音環境下における NAM 認識実験を行う.実験結果から,深層学習に基づく話者 ・ 環境依存音響モデルの有効性を示すとともに,一部の雑音環境下においては静寂環境下と同等の認識性能が得られることを示す. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this research, we aim to improve the performance of non-audible murmur (NAM) recognition towards the development of silent speech interfaces. First, we apply a deep learning technique to the acoustic modeling of NAM and develop speaker-dependent acoustic models using speaker adaptive training for a deep neural network (DNN). Moreover, to improve the recognition performance under noisy conditions, we also develop the noise-dependent acoustic models using noisy NAM data generated by superimposing noise signals recorded with NAM microphone. Experimental results show that our developed speaker- and noise-dependent acoustic models are effective for significantly improving NAM recognition performance under both clean and noisy conditions and achieving recognition performance under some noisy conditions comparable to that under the clean condition. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2017-SLP-119,
号 2,
p. 1-4,
発行日 2017-12-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |