WEKO3
アイテム
句読点を同時予測する End-to-End 音声認識
https://ipsj.ixsq.nii.ac.jp/records/214910
https://ipsj.ixsq.nii.ac.jp/records/214910d98675f9-20be-430c-bc06-6c146f5534d1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-04 | |||||||||||
タイトル | ||||||||||||
タイトル | 句読点を同時予測する End-to-End 音声認識 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 人工知能と認知科学 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
著者所属 | ||||||||||||
京大 | ||||||||||||
著者所属 | ||||||||||||
京大 | ||||||||||||
著者所属 | ||||||||||||
京大 | ||||||||||||
著者名 |
野崎, 樹文
× 野崎, 樹文
× 稲熊, 寛文
× 河原, 達也
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 音声認識システムの出力するテキストには一般に句読点が含まれていない。これは音声認識結果の可読性を下げる要因の一つであり、また、機械翻訳などの後続の自然言語処理タスクへの入力としても望ましくない。本研究では句読点の付いた音声認識結果を一つのモデルで直接出力可能なシステムを提案する。具体的には Transformer の枠組みを使用して句読点を同時に予測する音声認識システムを実現する。これにより音響情報を使用しながら、音声認識誤りに対して頑健に句読点を予測することを目指す。さらに、従来のテキスト情報のみから句読点を予測するシステムとの性能を比較する。 | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN00349328 | |||||||||||
書誌情報 |
第83回全国大会講演論文集 巻 2021, 号 1, p. 213-214, 発行日 2021-03-04 |
|||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |