ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2022
  4. 2022-SLP-144

Density Ratio Approachに基づく複数Encoder-Decoder音声認識モデル統合手法

https://ipsj.ixsq.nii.ac.jp/records/222622
https://ipsj.ixsq.nii.ac.jp/records/222622
c479b719-cac0-43ee-85dc-b7104a468290
名前 / ファイル ライセンス アクション
IPSJ-SLP22144006.pdf IPSJ-SLP22144006.pdf (1.8 MB)
Copyright (c) 2022 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2022-11-22
タイトル
タイトル Density Ratio Approachに基づく複数Encoder-Decoder音声認識モデル統合手法
タイトル
言語 en
タイトル Density Ratio Approach-based multiple Encoder–Decoder ASR model integration
言語
言語 jpn
キーワード
主題Scheme Other
主題 音声認識(1)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
豊橋技術科学大学
著者所属
豊橋技術科学大学
著者所属
豊橋技術科学大学
著者所属
日本電信電話株式会社
著者所属
豊橋技術科学大学
著者所属(英)
en
Toyohashi University of Technology
著者所属(英)
en
Toyohashi University of Technology
著者所属(英)
en
Toyohashi University of Technology
著者所属(英)
en
NIPPON TELEGRAPH AND TELEPHONE CORPORATION
著者所属(英)
en
Toyohashi University of Technology
著者名 北條, 圭悟

× 北條, 圭悟

北條, 圭悟

Search repository
森, 大輝

× 森, 大輝

森, 大輝

Search repository
若林, 佑幸

× 若林, 佑幸

若林, 佑幸

Search repository
小川, 厚徳

× 小川, 厚徳

小川, 厚徳

Search repository
北岡, 教英

× 北岡, 教英

北岡, 教英

Search repository
著者名(英) Keigo, Hojo

× Keigo, Hojo

en Keigo, Hojo

Search repository
Daiki, Mori

× Daiki, Mori

en Daiki, Mori

Search repository
Yukoh, Wakabayashi

× Yukoh, Wakabayashi

en Yukoh, Wakabayashi

Search repository
Atsunori, Ogawa

× Atsunori, Ogawa

en Atsunori, Ogawa

Search repository
Norihide, Kitaoka

× Norihide, Kitaoka

en Norihide, Kitaoka

Search repository
論文抄録
内容記述タイプ Other
内容記述 Encoder–Decoder 音声認識の性能を改善する手法として音声認識モデルと言語モデルの統合がある.音声認識モデルと言語モデルの統合手法の一つとして,Density Ratio Approach(DRA)が登場し,標準的な統合手法である shallow fusion の性能を上回ることが判明した.我々はこの DRA を応用し,複数の音声認識モデルを併用し,それらが持つ情報を統合することで得られる頑健な音響情報と音声認識モデルが学習していない言語情報を統合する手法を提案する.この提案手法の有効性を検証するため,文字誤り率を用いて従来の統合手法との比較を行った.実験の結果,提案手法は 1 つの音声認識モデルを使用した従来の統合手法よりも高い性能であることが確認された.また,提案手法で用いる複数の音声認識モデルの学習に用いたデータをすべて用いて学習された音声認識モデルの精度を超えることはできなかったが,新たな音声認識モデルを学習することなく,それに近い性能を得た.
論文抄録(英)
内容記述タイプ Other
内容記述 One of the methods to improve the performance of Encoder–Decoder speech recognition is the integration of an ASR models and a language model. Based on the Density Ratio Approach, we propose a method to build an ASR system by integrating multiple ASR models and combining them with an external language models. The proposed method enables speech recognition use a variety of acoustic information and linguistic information that has not been learned by the ASR models. Experimental results show that the proposed method is more accurate than conventional integration methods.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2022-SLP-144, 号 6, p. 1-5, 発行日 2022-11-22
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 13:40:33.302882
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3