WEKO3
アイテム
PodCastle:ポッドキャスト音声認識のための集合知を活用した言語モデル学習
https://ipsj.ixsq.nii.ac.jp/records/67647
https://ipsj.ixsq.nii.ac.jp/records/67647ee3e8b22-2e55-40c3-a2b9-9d2c584fd0cd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-02-05 | |||||||
タイトル | ||||||||
タイトル | PodCastle:ポッドキャスト音声認識のための集合知を活用した言語モデル学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | PodCastle: Collaborative Training of Language Models Based on Wisdom of Crowds for Podcast Transcription | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声認識,キーワード検出 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者名 |
緒方, 淳
× 緒方, 淳
|
|||||||
著者名(英) |
Jun, Ogata
× Jun, Ogata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,ポッドキャスト音声認識の性能向上のための言語モデル学習手法について述べる.実環境音声であるポッドキャストは,その発話スタイルやトピックなどが多様であるため,従来のように特定タスクの事前コーパスに基づいて高精度な言語モデルを構築することはできない.そこで,本研究では Web サービス 「PodCastle」 を通じて得られる集合知,すなわちエンドユーザによる音声認識誤りの訂正結果を活用した言語モデル学習手法を提案する.ポッドキャスト音声認識実験の結果,本学習システムが有効に働くことを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents language modeling techniques for improving automatic transcription of podcasts. Since podcasts include various kinds of tasks and topics, accurate language modeling based on task-specific corpora is impractical. To solve this problem, we introduce collaborative training of language models on the basis of wisdom of crowds, i.e., podcast-speech transcripts annotated by anonymous users on our web service PodCastle. From our experimental results on actual podcast speech data, the effectiveness of the proposed language model training was confirmed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2010-SLP-80, 号 10, p. 1-6, 発行日 2010-02-05 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |