WEKO3
アイテム
CSJを用いた日本語講演音声認識へのDNN-HMMの適用と話者適応の検討
https://ipsj.ixsq.nii.ac.jp/records/94550
https://ipsj.ixsq.nii.ac.jp/records/94550e31126bd-8ad2-4702-85d5-4aaf2eb64a7d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2013-07-18 | |||||||
| タイトル | ||||||||
| タイトル | CSJを用いた日本語講演音声認識へのDNN-HMMの適用と話者適応の検討 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | オーガナイズドセッション【一般講演】 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属 | ||||||||
| 京都大学学術情報メディアセンター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies, Kyoto University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Academic Center for Computing and Media Studies, Kyoto University | ||||||||
| 著者名 |
三村正人
河原達也
× 三村正人 河原達也
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 近年、深い階層構造を持つニューラルネットワーク (DNN) と HMM を組み合わせたハイブリッド型モデル (DNN-HMM) の有効性が種々の音声認識タスクで報告されている。本研究では、DNN-HMM を 『日本語話し言葉コーパス』(CSJ) を用いて構築し、種々の日本語講演音声タスクで評価を行う。また、類似話者を用いたネットワークの再学習による適応手法を提案する。DNN-HMM は CSJ の評価セットに対して、従来の GMM-HMM より 2.5% 高い認識精度を示した。また、階層を増やす毎に認識精度が向上した。CSJ と音響条件や話題の異なるシンポジウムの講演音声に対しても、すべての話者で認識精度が向上し、平均で 5.4% の向上があった。話者適応実験では、類似話者を用いた手法により 2% 精度が向上した。さらに、認識対象音声の初期認識結果と類似話者の両者を用いた再学習により 3.4% 精度が向上した。 | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2013-SLP-97, 号 9, p. 1-6, 発行日 2013-07-18 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||