Item type |
SIG Technical Reports(1) |
公開日 |
2022-06-10 |
タイトル |
|
|
タイトル |
BERTを用いた音声翻訳のための音声認識結果訂正の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Study of Speech Recognition Result Correction for Speech Translation Using BERT |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション1 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者名 |
小椋, 忠志
藤本, 雅清
沈, 鵬
Lu, Xugang
河井, 恒
|
著者名(英) |
Tadashi, Ogura
Masakiyo, Fjimoto
Peng, Shen
Xugang, Lu
Hisashi, Kawai
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
音声認識と機械翻訳からなる音声翻訳技術においては,入り口となる音声認識の性能改善が重要である.しかし,単純な音声認識器の改善のみでは問題解決は難しく,音声認識結果に対する何らかの誤り訂正処理が必要である.そこで本研究では,近年注目を集めている巨大言語モデル BERT を用いた音声翻訳向けの音声認識結果訂正手法について検討した.提案手法では文脈を考慮した訂正を行うことができ,発話内容の「意味」や「意図」を違えることを軽減した高精度な音声翻訳結果を得ることができる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Speech translation (ST) technology consists of automatic speech recognition (ASR) and machine translation technologies. Since ASR is the first module to be processed in ST, improving ASR performance is a critical factor in ST. However, it is difficult to solve this problem by pursuing only improvement of ASR performance, and error correction processing for ASR results is strongly required. Therefore, in this paper, we propose an error correction method for ASR results to improve ST performance using the state-of-the-art huge scale language model, BERT. The proposed method realizes context-aware error correction for ASR results, and successfully improves the accuracy of ST by reducing misunderstandings of “meaning" and "intention" of utterances. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2022-SLP-142,
号 20,
p. 1-4,
発行日 2022-06-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |