Item type |
SIG Technical Reports(1) |
公開日 |
2016-12-13 |
タイトル |
|
|
タイトル |
コクレオグラムとスペクトログラムを用いた深層学習音声認識 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Deep Learning-based ASR using Cochleogram and Spectrogram Features Combination |
言語 |
|
|
言語 |
eng |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声分析,特徴抽出 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
著者所属 |
|
|
|
インドネシア大学 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Universitas Indonesia |
著者所属(英) |
|
|
|
en |
|
|
Nara Institute of Science and Technology |
著者名 |
アンドロス, チャンドラ
サクリアニ, サクティ
ミルナ, アドリアーニ
中村, 哲
|
著者名(英) |
Andros, Tjandra
Sakriani, Sakti
Mirna, Adriani
Satoshi, Nakamura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本論文では,対数メル尺度やスペクトログラムにコクリオグラムを加えた特徴ベクトルを用いた,Deep Neural Network (DNN),Convolutional Neural Network (CNN) による音声認識システムを提案する.TIMIT 音素認識タスクにおいて,スペクトログラムーコクリオグラムを用いた CNN で,スペクトログラムのみを用いた,CNN に対して 8.2%,DNN に対して 19.7% の性能向上を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes various possibilities to combine coehleogram features with log-mel filter banks or spectrogram features within the DNN and CNN framework. Performance was evaluated on TIMIT phoneme sequence recognition task. The best accuracy was obtained by high-level combination of two dimensional cochleogram-spectrogram features using CNN, achieved up to 8.2% relative phoneme error rate (PER) reduction from CNN single features or 19.7% relative PER reduction from DNN single features. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2016-SLP-114,
号 24,
p. 1-2,
発行日 2016-12-13
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |