@techreport{oai:ipsj.ixsq.nii.ac.jp:00056576,
 author = {西亀, 健太 and 和泉, 洋介 and 渡部, 晋治 and 西本, 卓也 and 小野, 順貴 and 嵯峨山, 茂樹 and Kenta, Nishiki and Yousuke, Izumi and Shinji, Watanabe and Takuya, Nishimoto and Nobutaka, Ono and Shigeki, Sagayama},
 issue = {123(2008-SLP-074)},
 month = {Dec},
 note = {本稿ではスパース性に基づくブラインド音源分離をフロントエンドに用いた雑音残響下における 2 チャンネル入力音声認識を提案する. 2 チャンネルブラインド音源分離により観測音からターゲット音声が分離される.本稿で用いた音源分離手法ではEMアルゴリズムによって設計された時間周波数マスキングを行うことにより残響などの拡散性雑音下でも精度よく音源分離を行うものである.音源分離後に残った歪みや,新たに生じた歪みに関しては Cepstral Mean Nomalization による抑圧を行う提案手法に対し,複数妨害音および残響の存在下における連続数字音声認識タスクにおいて提案手法の有効性を確認し,特に残響下で比較手法より高い認識性能を実現した., This paper discusses a two-channel input speech recognition using a sparsness-based blind source sep aration. The target speech is extracted from observed signals under diffusive noises (e.g. reverberation) by the source separation technique where a time-frequency mask is dynamically designed for speech separation using the EM algorithm. Cepstral Mean Normalization is exploited to reduce a remaining distortions or a newly introduced distortions in separated speech features. In a connected digit recognition task with multiple noise sources, the proposed method drastically improved the word accuracy in anechoic and reverberant environments. The proposed method achieved higher performance especially in a reverberant environment than conventional methods.},
 title = {スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識},
 year = {2008}
}