プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正

神谷, 賢太郎; 東中, 竜一郎; 川瀬, 卓也; 長尾, 確

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正

https://ipsj.ixsq.nii.ac.jp/records/214911

名前 / ファイル	ライセンス	アクション
IPSJ-Z83-6N-03.pdf (385.9 kB)	Copyright (c) 2021 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2021-03-04

タイトル

プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

名大

著者所属

名大

著者所属

名大

著者所属

名大

著者名

神谷, 賢太郎
東中, 竜一郎
川瀬, 卓也
長尾, 確

論文抄録

内容記述タイプ

Other

内容記述

プレゼンテーションの発表者の発言を高精度で音声認識することは，多くの専門用語が使用されることなどから困難である．そこで，本研究では，プレゼンテーションで使用されるスライド情報と認識対象の周辺の発言を補足情報として用い，音声認識結果を修正することで音声認識精度の改善を試みる．この修正には，深層学習モデルを用い，音声認識結果と補足情報から抽出した特徴量を入力とし，音声認識結果の正解を出力するようにモデルの学習を行う．実際のプレゼンテーションデータを対象とした実験の結果，提案手法が音声認識精度の改善につながることを確認した．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第83回全国大会講演論文集

巻 2021, 号 1, p. 215-216, 発行日 2021-03-04

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 16:24:36.533852

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正

× 神谷, 賢太郎

× 東中, 竜一郎

× 川瀬, 卓也

× 長尾, 確

Versions

Share

Cite as

エクスポート