WEKO3
アイテム
コンテンツ活用のための報道番組自動書き起こしシステム
https://ipsj.ixsq.nii.ac.jp/records/62681
https://ipsj.ixsq.nii.ac.jp/records/62681407ccfcd-85f4-4d91-84ce-5725a3a9ae28
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-07-10 | |||||||
タイトル | ||||||||
タイトル | コンテンツ活用のための報道番組自動書き起こしシステム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Broadcast News Transcription System for Content Application | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 書き起こし | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technology Research Laboratories | ||||||||
著者名 |
小林, 彰夫
奥, 貴裕
本間, 真一
佐藤, 庄衛
今井, 亨
都木, 徹
× 小林, 彰夫 奥, 貴裕 本間, 真一 佐藤, 庄衛 今井, 亨 都木, 徹
|
|||||||
著者名(英) |
Akio, Kobayashi
Takahiro, Oku
Shinich, Homma
Shoei, Sato
Toru, Imai
Tohru, Takagi
× Akio, Kobayashi Takahiro, Oku Shinich, Homma Shoei, Sato Toru, Imai Tohru, Takagi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では,放送コンテンツ活用のための報道番組自動書き起こしシステムについて述べる.本システムは,音声認識のための学習・評価データを収集したり,放送番組に付与するメタデータを抽出・制作するために,報道番組の音声を随時認識して,映像・音声とともに認識結果を蓄積する.音声認識は,音楽箇所・男女の発話区間の検出を行いながらリアルタイムでデコードを行い,デコードと並行して,話者識別により発話に話者タグを付与する.言語モデルは,ウェブ上のニューステキストを取得して随時更新される.また,音声認識により得られたラティスをコンフュージョンネットワークに圧縮し,キーワード検索用のインデックスを生成する.本システムを用いてニュース 53 番組の評価を行ったところ,単語誤り率は 9.2% となった.また,unigram クエリを用いたキーワード検索の結果,F 値は約 95 となった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a new transcription system for content application. The system archives broadcast news programs with their transcriptions and speaker tags with the aim of getting a collection of training and evaluation data for acoustic and language models. Besides it is also utilized for extracting and describing metadata for TV programs. The system has the functions of music and speech detection during dual-gender decoding, speaker diarization, and automatic language model updating for upcoming news shows. Trigram lattices are compressed into confusion networks that are indexed for known item retrieval. The system achieved a 9.2 % of word error rate and a 95 of F-measure in evaluation of known item retrieval for 53 Japanese broadcast news shows. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-77, 号 20, p. 1-6, 発行日 2009-07-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |