Item type |
SIG Technical Reports(1) |
公開日 |
2014-12-08 |
タイトル |
|
|
タイトル |
年齢・性別に依存しないDNN-HMMによる音声認識法の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Consideration on Age- and Gender-independent Speech Recognition using DNN-HMM |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスター・デモセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者名 |
関, 博史
山本, 一公
中川, 聖一
|
著者名(英) |
Hiroshi, Seki
Kazumasa, Yamamoto
Seiichi, Nakagawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
我々は,従来から音節単位音響モデリングについて研究を行っている.そこで本研究では,まず音節単位および音素単位 DNN-HMM を構築し,これらの認識精度について調査を行った.その結果,triphone,コンテキスト独立音節いずれもほぼ等しい認識精度を示した.次に,3 つの年齢層 (成人・老人・子供) と性別 (男性・女性) ごとに計 6 つのクラスの学習データを用意し,年齢・性別に依存しない DNN-HMM の検討を行った.一般的に,不特定話者を対象とした音声認識システムは,話者特定システムに比べ,認識性能が低下してしまう.しかしクラス毎に特徴量を正規化することで,すべてのクラスを用いて一つのモデルを学習した場合でも,クラスごとに DNN-HMM を学習したモデルを上回る認識精度を得ることが出来た.最後に,クラス情報のネットワークへの組み込みを検討した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We have studied syllable-based acoustic modeling for Japanese speech recognition. In this paper, we first investigate the performance of recognition accuracy using phoneme/syllable-based DNN-HMM. The results show that there's no significant difference between phoneme/syllable-based DNN-HMM. Second, we investigate the age- and gender-independent speech recognition using DNN-HMM. We use three types of corpora(adult, elder, child), and each corpus contains male and female speech data. In general, speaker-independent system cannot handle the specific information of speakers, and the recognition performance of speaker independent model is lower that of speaker dependent model. Our experimental results show that one DNN-HMM trained by all corpora with a class-dependent feature normalization method achieves better performance compared to class-dependent DNN-HMMs. Finally, we investigate the incorporation of information on corpora into DNN. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2014-SLP-104,
号 29,
p. 1-6,
発行日 2014-12-08
|
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |