句読点を同時予測する End-to-End 音声認識

野崎, 樹文; 稲熊, 寛文; 河原, 達也

WEKO3

インデックスツリー

RootNode

アイテム

句読点を同時予測する End-to-End 音声認識

https://ipsj.ixsq.nii.ac.jp/records/214910

名前 / ファイル	ライセンス	アクション
IPSJ-Z83-6N-02.pdf (267.8 kB)	Copyright (c) 2021 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2021-03-04

タイトル

句読点を同時予測する End-to-End 音声認識

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

京大

著者所属

京大

著者所属

京大

著者名

野崎, 樹文
稲熊, 寛文
河原, 達也

論文抄録

内容記述タイプ

Other

内容記述

音声認識システムの出力するテキストには一般に句読点が含まれていない。これは音声認識結果の可読性を下げる要因の一つであり、また、機械翻訳などの後続の自然言語処理タスクへの入力としても望ましくない。本研究では句読点の付いた音声認識結果を一つのモデルで直接出力可能なシステムを提案する。具体的には Transformer の枠組みを使用して句読点を同時に予測する音声認識システムを実現する。これにより音響情報を使用しながら、音声認識誤りに対して頑健に句読点を予測することを目指す。さらに、従来のテキスト情報のみから句読点を予測するシステムとの性能を比較する。

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第83回全国大会講演論文集

巻 2021, 号 1, p. 213-214, 発行日 2021-03-04

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 16:24:38.018388

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

句読点を同時予測する End-to-End 音声認識

× 野崎, 樹文

× 稲熊, 寛文

× 河原, 達也

Versions

Share

Cite as

エクスポート