WEKO3
アイテム
ニュース音声認識のための(n≧4)- gramを併用する言語モデル
https://ipsj.ixsq.nii.ac.jp/records/57577
https://ipsj.ixsq.nii.ac.jp/records/57577dcfba621-7d00-48d5-b5fa-b1470b4b7717
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-12-20 | |||||||
タイトル | ||||||||
タイトル | ニュース音声認識のための(n≧4)- gramを併用する言語モデル | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A New Language Model by using (n≧4) - gram for Broadcast News Speech Transcription | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
ATR音声翻訳通信研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属 | ||||||||
NHK放送技術研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telecommunications Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NHK Science and Technical Research Laboratories | ||||||||
著者名 |
加藤, 直人
浦谷則好
江原暉将
安藤, 彰男
× 加藤, 直人 浦谷則好 江原暉将 安藤, 彰男
|
|||||||
著者名(英) |
Naoto, Katoh
Noriyoshi, Uratani
Terumasa, Ehara
Akio, Ando
× Naoto, Katoh Noriyoshi, Uratani Terumasa, Ehara Akio, Ando
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識の精度向上には言語制約が強い言語モデルを構成すること必要であり,その一つの方法がタスク適応である.一方で,タスク適応しすぎると頑健性が損なわれるという問題がある.本稿では(n≧4)?gramを利用することによりタスクへの適応をしつつ,2 3-gramも利用することで頑健性もそれほど損なわない言語モデルについて述べる.提案する言語モデルでは(n≧4)-gramを,従来のn-gramのように宣言的知識として記憶するのではなく,単語出現位置辞書という概念を導入して手続き的知識として記憶することによりそれほどデータ量を増やすことなく利用している.本言語モデルを放送ニュースに応用し,そのperplexityによる評価実験を行ったところ,良好な結果を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Language model adaptation is one of the important methods to construct a speech recognition system for practical use. The conventional adaptation methods adjusted n-gram estimated from various task corpora to ones from a specific task corpus. However the methods are not so effective in some tasks such as TV news, because some of TV news does not use news scripts. This paper proposes a new language model for Broadcast news speech transcription. Our model can not only adapt to a specific task but also deal with the more tasks by dynamically using (n≧4)-gram and 2,3-gram. The proposed method can reduce amount of (n≧4)-gram data by registering it as procedural knowledge through WPD (Word Position Data). The WPD represents each position of words in a task corpus and is automatically composed of the corpus. We conducted a serirs of experiments to evaluate our model and obtained a good result. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 108(1999-SLP-029), p. 187-192, 発行日 1999-12-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |