WEKO3
アイテム
原言語テキストを補助入力とするTransformer同時通訳音声認識における大規模機械翻訳コーパスを用いた事前学習の検討
https://ipsj.ixsq.nii.ac.jp/records/236041
https://ipsj.ixsq.nii.ac.jp/records/23604195160078-9fc0-49d4-80af-457faa6b3776
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2024 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-03-01 | |||||||||||||
タイトル | ||||||||||||||
タイトル | 原言語テキストを補助入力とするTransformer同時通訳音声認識における大規模機械翻訳コーパスを用いた事前学習の検討 | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
キーワード | ||||||||||||||
主題Scheme | Other | |||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
資源タイプ | conference paper | |||||||||||||
著者所属 | ||||||||||||||
同志社大 | ||||||||||||||
著者所属 | ||||||||||||||
同志社大 | ||||||||||||||
著者所属 | ||||||||||||||
同志社大 | ||||||||||||||
著者所属 | ||||||||||||||
マインドワード株式会社 | ||||||||||||||
著者名 |
谷口, 秀太
× 谷口, 秀太
× 加藤, 恒夫
× 田村, 晃裕
× 安田, 圭志
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | 同時通訳の音声認識は,フィラーや言い淀み,言い直しが含まれるため簡単ではない.筆者らは同時通訳の音声認識のために,原言語テキストを補助入力とするTransformer音声認識を提案してきた.これまで,提案モデルの学習に必要となる大規模な音声・書き起こし・原言語テキストの三つ組データとして,音声翻訳開発用のMust-Cコーパスを転用してきたが,原言語テキストエンコーダの学習用コーパスとしては十分でなかった.そこで,より大規模な機械翻訳開発用のWMTコーパスを用いて提案モデルの事前学習を行った.実験の結果,同時通訳音声認識においてWERを0.7ポイント削減した. | |||||||||||||
書誌レコードID | ||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||
収録物識別子 | AN00349328 | |||||||||||||
書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 397-398, 発行日 2024-03-01 |
|||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |