WEKO3
アイテム
講演スライドの文字認識結果を用いた音声認識の改善
https://ipsj.ixsq.nii.ac.jp/records/102194
https://ipsj.ixsq.nii.ac.jp/records/1021941fa20f8f-93eb-4b0f-802d-e228ce4bef15
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-07-17 | |||||||
タイトル | ||||||||
タイトル | 講演スライドの文字認識結果を用いた音声認識の改善 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 講演音声認識 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科/京都大学学術情報メディアセンター | ||||||||
著者所属 | ||||||||
京都大学情報学研究科/京都大学学術情報メディアセンター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University / Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University / Academic Center for Computing and Media Studies, Kyoto University | ||||||||
著者名 |
童弋正
× 童弋正
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 講演の音声認識において言語モデル適応のためのテキストとしてスライドの利用が考えられるが,スライドの電子ファイルを必ず入手できるとは限らない.そこで本研究では,講演映像中のスライドの文字認識結果を利用して言語モデルの適応を行い,音声認識の精度の改善を目指す.文字認識結果には多くの誤りが含まれることから,本研究では形態的・話題的な面からこれらをフィルタリングする手法を提案する.これにより得られたスライド文字認識結果をもとに、関連する新聞記事を用いた適応、またスライドを用いたキャッシュモデルに基づく適応を行う.実際の講演データを用いた評価で、音声認識精度の改善を得ることができた. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2014-SLP-102, 号 3, p. 1-6, 発行日 2014-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |