ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2022
  4. 2022-SLP-142

ゼロ資源言語の認識に向けたMAMLに基づくend-to-end音声認識の検討

https://ipsj.ixsq.nii.ac.jp/records/218473
https://ipsj.ixsq.nii.ac.jp/records/218473
0e497d84-dcde-458d-bca8-7bb935d99ed7
名前 / ファイル ライセンス アクション
IPSJ-SLP22142014.pdf IPSJ-SLP22142014.pdf (1.1 MB)
Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2022-06-10
タイトル
タイトル ゼロ資源言語の認識に向けたMAMLに基づくend-to-end音声認識の検討
タイトル
言語 en
タイトル MAML-based End-to-End Speech Recognition for Zero-Resource Language Recognition
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション1
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東北大学工学研究科
著者所属
東北大学工学研究科
著者所属
東北大学工学研究科
著者所属(英)
en
Tohoku University Graduate School of Engineering
著者所属(英)
en
Tohoku University Graduate School of Engineering
著者所属(英)
en
Tohoku University Graduate School of Engineering
著者名 周, 鋭

× 周, 鋭

周, 鋭

Search repository
伊藤, 彰則

× 伊藤, 彰則

伊藤, 彰則

Search repository
能勢, 隆

× 能勢, 隆

能勢, 隆

Search repository
著者名(英) Rui, Zhou

× Rui, Zhou

en Rui, Zhou

Search repository
Akinori, Ito

× Akinori, Ito

en Akinori, Ito

Search repository
Takashi, Nose

× Takashi, Nose

en Takashi, Nose

Search repository
論文抄録
内容記述タイプ Other
内容記述 高い精度の音声認識システムを開発するためには,大量のラベル付け音声データが必要である.しかし,世界中にある言語の大部分については,そのように多くの学習データを用意することはできない.このような言語の音声認識システムを開発するため,学習時に目標言語のデータを使用しない,または非常に少ないデータのみを使って開発する音声認識システムがゼロリソース音声認識システムである.本稿では,メタラーニングの学習方法である MAML とハイリソース言語データを用いて,モデルを事前学習する.そして,少数の目標言語のデータを使って,モデルを微調整する.20 分程度の目標言語データを使用して,MAML による学習を行ったところ 40% 程度の CER が得られた.
論文抄録(英)
内容記述タイプ Other
内容記述 High-precision speech recognition systems require large amounts of labeled speech data. However, most of the languages in the world do not have that much training data. A speech recognition system that uses no speech data, or uses very little data from such training target languages, is called a zero resource speech recognition system. In this paper, we pre-train a model using a training method called MAML and high-resource language data. Then we use a data of a minority language to fine-tune the model. When we use 20 minutes of the target language data, we obtained a character error rate of about 40%.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2022-SLP-142, 号 14, p. 1-6, 発行日 2022-06-10
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 15:09:00.540663
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3