@techreport{oai:ipsj.ixsq.nii.ac.jp:00057437, author = {馬場, 朗 and 芳澤伸一 and 山田, 実一 and 李晃伸 and 鹿野, 清宏 and Akira, Baba and Shinichi, Yoshizawa and Miichi, Yamada and Akinobu, Lee and Kiyohiro, Shikano}, issue = {11(2000-SLP-035)}, month = {Feb}, note = {近年、大語彙連続音声認識を利用したシステムの普及に伴い、さまざまな用途で音声認識が利用されるようになりつつある。音声認識システムの性能に悪影響を与える要因の一つとして、システムを利用するユーザーの音響特性と音響モデルとの間のミスマッチがある。一般に、音響モデルの学習には成人音声を用いるため、高齢者の音響特性との間にミスマッチを生じ、認識率の低下を生じる可能性がある。本論文では、大規模な高齢者音声データベース(200文章×301人)を用いて音響モデルの学習を行い、この高齢者向け音響モデルを大語彙連続音声認識システムにおいて評価した。実験結果では、成人データベース(150文章×260人)から学習したモデルによる認識結果と比較して、3?5%の単語認識率の改善が得られた。, Speech recognition technologies have been widely used in various areas due to the recent developments of large vocabulary continuous speech recognition (LVCSR) algorithms. Acoustical difference among speakers is considered to be one of the main reasons for the degradation of speech recognition rates. Especially, the acoustic difference between elder speaker speech database and usual adult speech database should be evaluated and researched for elder speakers to use speech recognition systems. In this paper we evaluated elder speaker acoustic models in LVCSR, which are trained by the 301-elder-speaker utterance database, where each speaker utters 200 sentences. The elder speaker PTM acoustic model attains 88.9% word recognition rate, which better than 85.4% word recognition rate by the usual aduld PTM acoustic model.}, title = {高齢者向け音響モデルによる大語彙連続音声認識の評価}, year = {2001} }