WEKO3
アイテム
ニュース音声認識における言語モデルの検討
https://ipsj.ixsq.nii.ac.jp/records/57731
https://ipsj.ixsq.nii.ac.jp/records/57731abf4a1bc-f488-4b1b-b944-31cb91baf8c8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-12-11 | |||||||
タイトル | ||||||||
タイトル | ニュース音声認識における言語モデルの検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Performance evaluation of language models for broadcast news speech recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電気通信大学情報工学科 | ||||||||
著者所属 | ||||||||
電気通信大学情報工学科 | ||||||||
著者所属 | ||||||||
電気通信大学情報工学科 | ||||||||
著者所属 | ||||||||
電気通信大学情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro - Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The University of Electro - Communications | ||||||||
著者名 |
高木, 一幸
× 高木, 一幸
|
|||||||
著者名(英) |
Kazuyuki, Takagi
× Kazuyuki, Takagi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ニュース音声は読み上げ音声に比べ音声認識が困難な題材であるが、高齢者・聴覚障害者のための字幕付与サービスなどへの応用が期待されている。今年になって、NHKニュース放送音声のデータベースが構築され、これを対象とした音声認識タスクが研究されている。大語彙音声認識には精度の良い言語モデルが不可欠であるが、本研究では、() 附属語連鎖・複合名詞を連語として登録し一単語として扱う連語モデル、() 名詞語彙をタスクに合わせて入れ換える名詞フラットモデル、() 品詞に基づいて語粟を分類した品詞クラスモデル、という3種類の N?gram言語モデルを作成した。その結果、() についてはパープレキシティの改善が見られた。これらの言語モデルをニュース音声認識に適用した結果について報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The focus of LVCSR research has shifted recently to more real world data, such as TV broadcast news speech, recognition of which aims at variety of applications such as the subtitling of TV program. Language modeling has a siginificant effect on recognition performance of LVCSR system, as well as the acoustic modeling. In this report, we evaluated the performance of N-gram language models for NHK TV news speech recognition task. Three types of models were created, i.e., (1) word phrase models of function words and compound nouns, (2) langage model with uniform noun unigram, (3) POS-based class language model, among of which word phrase model achieved improvement on language perplexity. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1997, 号 120(1997-SLP-019), p. 73-80, 発行日 1997-12-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |