WEKO3
アイテム
プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正
https://ipsj.ixsq.nii.ac.jp/records/214911
https://ipsj.ixsq.nii.ac.jp/records/2149112e1c655c-1d40-4cfa-bfb9-7a95861cc2a1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-04 | |||||||||||||
タイトル | ||||||||||||||
タイトル | プレゼンテーションにおけるスライド情報を用いた音声認識結果の自動修正 | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
キーワード | ||||||||||||||
主題Scheme | Other | |||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
資源タイプ | conference paper | |||||||||||||
著者所属 | ||||||||||||||
名大 | ||||||||||||||
著者所属 | ||||||||||||||
名大 | ||||||||||||||
著者所属 | ||||||||||||||
名大 | ||||||||||||||
著者所属 | ||||||||||||||
名大 | ||||||||||||||
著者名 |
神谷, 賢太郎
× 神谷, 賢太郎
× 東中, 竜一郎
× 川瀬, 卓也
× 長尾, 確
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | プレゼンテーションの発表者の発言を高精度で音声認識することは,多くの専門用語が使用されることなどから困難である.そこで,本研究では,プレゼンテーションで使用されるスライド情報と認識対象の周辺の発言を補足情報として用い,音声認識結果を修正することで音声認識精度の改善を試みる.この修正には,深層学習モデルを用い,音声認識結果と補足情報から抽出した特徴量を入力とし,音声認識結果の正解を出力するようにモデルの学習を行う.実際のプレゼンテーションデータを対象とした実験の結果,提案手法が音声認識精度の改善につながることを確認した. | |||||||||||||
書誌レコードID | ||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||
収録物識別子 | AN00349328 | |||||||||||||
書誌情報 |
第83回全国大会講演論文集 巻 2021, 号 1, p. 215-216, 発行日 2021-03-04 |
|||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |