WEKO3
アイテム
会話音声から句読点付きテキストの End-to-End 認識
https://ipsj.ixsq.nii.ac.jp/records/220893
https://ipsj.ixsq.nii.ac.jp/records/220893db08d05a-91bd-4a7a-ad40-b433a3abc09b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-02-17 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 会話音声から句読点付きテキストの End-to-End 認識 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 京大 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社RevComm | ||||||||||||||
| 著者所属 | ||||||||||||||
| 株式会社RevComm | ||||||||||||||
| 著者所属 | ||||||||||||||
| 京大 | ||||||||||||||
| 著者名 |
野崎, 樹文
× 野崎, 樹文
× 石塚, 賢吉
× 橋本, 泰一
× 河原, 達也
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 一般に音声認識システムの出力するテキストには句読点が含まれていない。これは音声認識結果の可読性を下げる要因の一つである。また、機械翻訳や自動要約などの後続の自然言語処理タスクへの入力として望ましくない。本研究では、音声を入力として句読点の付いたテキストを End-to-End に認識するモデルを提案する。これにより音響情報を使用しながら、音声認識誤りに対して頑健に句読点を予測することを目指す。評価実験は日本語と英語のデータセットを用いて行い、提案モデルの有効性を示す。さらに、BERTを用いて音声認識結果のテキスト情報のみから句読点を予測する従来のシステムとの性能を比較する。 | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||
| 書誌情報 |
第84回全国大会講演論文集 巻 2022, 号 1, p. 293-294, 発行日 2022-02-17 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||