WEKO3
アイテム
原言語テキストを補助入力とするTransformer同時通訳音声認識における大規模機械翻訳コーパスを用いた事前学習の検討
https://ipsj.ixsq.nii.ac.jp/records/236041
https://ipsj.ixsq.nii.ac.jp/records/23604195160078-9fc0-49d4-80af-457faa6b3776
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 原言語テキストを補助入力とするTransformer同時通訳音声認識における大規模機械翻訳コーパスを用いた事前学習の検討 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| マインドワード株式会社 | ||||||||||||||
| 著者名 |
谷口, 秀太
× 谷口, 秀太
× 加藤, 恒夫
× 田村, 晃裕
× 安田, 圭志
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 同時通訳の音声認識は,フィラーや言い淀み,言い直しが含まれるため簡単ではない.筆者らは同時通訳の音声認識のために,原言語テキストを補助入力とするTransformer音声認識を提案してきた.これまで,提案モデルの学習に必要となる大規模な音声・書き起こし・原言語テキストの三つ組データとして,音声翻訳開発用のMust-Cコーパスを転用してきたが,原言語テキストエンコーダの学習用コーパスとしては十分でなかった.そこで,より大規模な機械翻訳開発用のWMTコーパスを用いて提案モデルの事前学習を行った.実験の結果,同時通訳音声認識においてWERを0.7ポイント削減した. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 397-398, 発行日 2024-03-01 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||