WEKO3
アイテム
二項事後分布に基づくN - gram言語モデルのBack - off平滑化
https://ipsj.ixsq.nii.ac.jp/records/57894
https://ipsj.ixsq.nii.ac.jp/records/5789425340355-c271-462c-b679-1d3ca85a919a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1995 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1995-12-14 | |||||||
タイトル | ||||||||
タイトル | 二項事後分布に基づくN - gram言語モデルのBack - off平滑化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Back - off Method for N - gram Smoothing based on Binomial Posteriori Distribution | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTT基礎研究所 | ||||||||
著者所属 | ||||||||
NTT基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Basic Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Basic Research Laboratories | ||||||||
著者名 |
川端, 豪
× 川端, 豪
|
|||||||
著者名(英) |
Takeshi, Kawabata
× Takeshi, Kawabata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | n?gram言語モデルは、自然音声言語を取り扱うための有力な手法の一つであるが信頼できるパラメータ推定のために、膨大な音声言語コーパスを必要とするという問題点があった。このため、疎(スパース)なデータがらn?gram確率を推定する種々の手法が提案されている。katzは学習コーパス中に出現しないn?gramの確率を(?)?gram確率から推定するback?off平滑の考え方を提案した。katzの定式化はturingの標本分布推定に基づくものであるが、状況によっては推定が不安定になることがある。本論文では、このback?off平滑法をkatzとは別の観点から理論的に再定式化することを試みる。二項事後確率分布の継承関係から導かれる新しいback?off平滑法は、より簡単な計算によって、希少標本からの安定な確率推定を実現する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The n-gram language models are powerful for treating natural spoken lauguages, however need large amounts of spoken language corpus for estimating reliable model paramleters. For estimating n-gram probabilities from sparse data, Katz's back-off smoothing method is promising. However, this approach is sometimes unstable because it uses singleton heuristics based on Turing's formula. This paper proposes a new back-off method based on Binomial Posteriori Distribution of n-gram probabilities, which achieves stable and more effective n-gram smoothing by sophisticated calculation formula with no heuristics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1995, 号 120(1995-SLP-009), p. 87-92, 発行日 1995-12-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |