WEKO3
アイテム
多言語音声の同時認識システムにおける翻訳モデルとスコア計算の高速化
https://ipsj.ixsq.nii.ac.jp/records/86048
https://ipsj.ixsq.nii.ac.jp/records/86048ac2eac0c-26a2-4490-97bf-09251ec6ee12
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-10-15 | |||||||
タイトル | ||||||||
タイトル | 多言語音声の同時認識システムにおける翻訳モデルとスコア計算の高速化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study of Translation Models and Score Calculation on Bilingual ASR Framework | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [一般論文] 音声認識,多言語音声処理,翻訳モデル,高速化 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
龍谷大学大学院理工学研究科 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者名 |
大村, 絵梨
× 大村, 絵梨
|
|||||||
著者名(英) |
Eri, Ohmura
× Eri, Ohmura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 国際会議やニュースでは,複数の言語で同一内容の発話がなされていることが多い.我々は,これまでにこのような多言語音声の音声認識の枠組み,具体的には,ある言語の音声とそれに対応する他言語の音声を,翻訳モデル(TM)を用いてお互いに情報を補い,同時に認識する枠組みを提案している.本論文では,多言語音声の同時認識システムにおけるTMモデル化手法およびTMスコア計算の高速化について研究を行った.IBMモデル1,モデル2およびモデル3のすべてについて,多言語音声の同時認識用のTMとして有効であることを明らかにした.ドメインの一致するコーパスを大量に用いて学習することの重要性を確認した.TMスコア計算では,スコア近似手法を提案し,音声認識精度の性能低下を抑えつつ高速化が行えることを示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper addresses automatic speech recognition (ASR) for multilingual audio contents. Conventionally, ASR has been performed independently, namely, language by language, although multilingual speech, which consists of utterances in several languages representing identical meaning, is available. We previously proposed a bilingual ASR framework based on statistical ASR and machine translation in which bilingual ASR is performed simultaneously and complementarily. In this simultaneous recognition framework, ASR systems use not only acoustic and language model scores but also a translation model (TM) score. In this study, we investigate a suitable TM modeling and an efficient calculation method of TM scores. We compared several TM models, which are trained with matched/unmatched domain corpus, and TM score calculation methods. We confirmed the effectiveness of IBM model-1, model-2 and model-3 based TMs and the significance of TM training with large amount of matched domain corpus. We significantly reduced processing time for TM score calculation without any degradation of ASR accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 53, 号 10, p. 2349-2358, 発行日 2012-10-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |