@techreport{oai:ipsj.ixsq.nii.ac.jp:00102197, author = {三村正人 and 坂井信輔 and 河原達也}, issue = {6}, month = {Jul}, note = {本研究では、フロントエンドとバックエンドの両方でディープラーニングを用いた残響下音声認識システムについて述べる。このシステムでは、フロントエンドでディープオートエンコーダ (DAE) を用いて音響特徴量の強調 (残響除去) を行い、バックエンドで DNN-HMM 音響モデルにより音声認識を行う。提案手法の性能を、Reverb Challenge 2014 の音声認識タスクにより評価した。まず、マルチコンディションデータを用いて学習した DNN-HMM による認識精度は、すべての残響条件で、MLLR 適応したベースライン GMM-HMM を顕著に上回った。次に、DAE による特徴量強調を行うことにより、クリーン音声を用いて学習した DNN-HMM の残響下音声認識精度を大幅に改善した。さらに、マルチコンディション学習 DNN-HMM と DAE の組み合わせにより、より困難な条件での認識精度が顕著に改善した。これに加えて、DNN により得られる音素識別情報を DAE の入力に追加することで、残響除去の性能が向上した。強調された特徴量に対する DNN-HMM の教師なし適応により、すべての条件で認識精度が向上した。}, title = {ディープオートエンコーダとDNN-HMMを用いた残響下音声認識}, year = {2014} }