WEKO3
アイテム
ライブストリーミングのための協調的音声書き起こしシステム
https://ipsj.ixsq.nii.ac.jp/records/72654
https://ipsj.ixsq.nii.ac.jp/records/7265464171199-e11f-4ca0-88d7-deeb5bf78759
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-01-28 | |||||||
タイトル | ||||||||
タイトル | ライブストリーミングのための協調的音声書き起こしシステム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Collaborative Speech Transcription System for Live Streaming | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 対話,システム | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
早稲田大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda University | ||||||||
著者名 |
浮田, 俊輔
× 浮田, 俊輔
|
|||||||
著者名(英) |
Shunsuke, Ukita
× Shunsuke, Ukita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,ustreamのようなライブストリーミングの配信動画中の音声を,不特定多数のユーザが協調してリアルタイムに書き起こすことが可能なシステム「Yourscribe」を提案する.従来,人手による書き起こしは労力が大きく,音声認識での書き起こしは精度が不十分であった.また,その精度不足を不特定多数のユーザによる訂正で補うPodCastleは,リアルタイムでの書き起こしには適していなかった.Yourscribeでは,各ユーザは動画視聴を中断せずに楽しみながら,気が向いたときに聴き取った断片的なテキストを入力するだけでよい.それらを多数のユーザから随時集めた後に,リアルタイムに音声認識した結果と照らし合わせることで,書き起こしテキストに自動的にまとめ上げることができる.これは「音声認識研究2.0」の新たな事例に位置づけられる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a real-time transcription system, “Yourscribe”, that enables anonymous users to collaboratively transcribe speech in live video streaming like ustream. In previous approaches, transcription by human was laborsome and transcription by speech recognition was error-prone. PodCastle was developed to overcome such errors of speech recognition by having anonymous users correct errors, but was not appropriate for real-time transcription. To use Yourscribe, each user can just voluntarily type a short phrase that was heard while enjoying the live video without any interruption. Those phrases from many users were aggregated at all times and matched with results of real-time speech recognition to automatically form the transcription. This is a new instance of our research approach, Speech Recognition Research 2.0”. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告 音声言語情報処理(SLP) 巻 2011-SLP-85, 号 8, p. 1-6, 発行日 2011-01-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |