@techreport{oai:ipsj.ixsq.nii.ac.jp:00102197,
 author = {三村正人 and 坂井信輔 and 河原達也},
 issue = {6},
 month = {Jul},
 note = {本研究では、フロントエンドとバックエンドの両方でディープラーニングを用いた残響下音声認識システムについて述べる。このシステムでは、フロントエンドでディープオートエンコーダ （DAE） を用いて音響特徴量の強調 （残響除去） を行い、バックエンドで DNN-HMM 音響モデルにより音声認識を行う。提案手法の性能を、Reverb Challenge 2014 の音声認識タスクにより評価した。まず、マルチコンディションデータを用いて学習した DNN-HMM による認識精度は、すべての残響条件で、MLLR 適応したベースライン GMM-HMM を顕著に上回った。次に、DAE による特徴量強調を行うことにより、クリーン音声を用いて学習した DNN-HMM の残響下音声認識精度を大幅に改善した。さらに、マルチコンディション学習 DNN-HMM と DAE の組み合わせにより、より困難な条件での認識精度が顕著に改善した。これに加えて、DNN により得られる音素識別情報を DAE の入力に追加することで、残響除去の性能が向上した。強調された特徴量に対する DNN-HMM の教師なし適応により、すべての条件で認識精度が向上した。},
 title = {ディープオートエンコーダとDNN-HMMを用いた残響下音声認識},
 year = {2014}
}