Item type |
SIG Technical Reports(1) |
公開日 |
2022-11-22 |
タイトル |
|
|
タイトル |
Density Ratio Approachに基づく複数Encoder-Decoder音声認識モデル統合手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Density Ratio Approach-based multiple Encoder–Decoder ASR model integration |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声認識(1) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
日本電信電話株式会社 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者所属(英) |
|
|
|
en |
|
|
NIPPON TELEGRAPH AND TELEPHONE CORPORATION |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi University of Technology |
著者名 |
北條, 圭悟
森, 大輝
若林, 佑幸
小川, 厚徳
北岡, 教英
|
著者名(英) |
Keigo, Hojo
Daiki, Mori
Yukoh, Wakabayashi
Atsunori, Ogawa
Norihide, Kitaoka
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Encoder–Decoder 音声認識の性能を改善する手法として音声認識モデルと言語モデルの統合がある.音声認識モデルと言語モデルの統合手法の一つとして,Density Ratio Approach(DRA)が登場し,標準的な統合手法である shallow fusion の性能を上回ることが判明した.我々はこの DRA を応用し,複数の音声認識モデルを併用し,それらが持つ情報を統合することで得られる頑健な音響情報と音声認識モデルが学習していない言語情報を統合する手法を提案する.この提案手法の有効性を検証するため,文字誤り率を用いて従来の統合手法との比較を行った.実験の結果,提案手法は 1 つの音声認識モデルを使用した従来の統合手法よりも高い性能であることが確認された.また,提案手法で用いる複数の音声認識モデルの学習に用いたデータをすべて用いて学習された音声認識モデルの精度を超えることはできなかったが,新たな音声認識モデルを学習することなく,それに近い性能を得た. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
One of the methods to improve the performance of Encoder–Decoder speech recognition is the integration of an ASR models and a language model. Based on the Density Ratio Approach, we propose a method to build an ASR system by integrating multiple ASR models and combining them with an external language models. The proposed method enables speech recognition use a variety of acoustic information and linguistic information that has not been learned by the ASR models. Experimental results show that the proposed method is more accurate than conventional integration methods. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2022-NL-254,
号 6,
p. 1-5,
発行日 2022-11-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |