WEKO3
アイテム
スパースな学習データにおけるPCFGの確率パラメタの推定法
https://ipsj.ixsq.nii.ac.jp/records/48853
https://ipsj.ixsq.nii.ac.jp/records/488531c0b094e-7031-4ea1-8be8-ccf56751d24f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-23 | |||||||
タイトル | ||||||||
タイトル | スパースな学習データにおけるPCFGの確率パラメタの推定法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A parameter Estimation of a Probabilistic Context Free Grammar on a Sparse Sample | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究科 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究科 | ||||||||
著者所属 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者名 |
冨浦洋一
× 冨浦洋一
|
|||||||
著者名(英) |
Yoichi, Tomiura
× Yoichi, Tomiura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 自然言語文の統語構造の曖昧さを絞り込む手法として,統語範疇を意味カテゴリで細分化することにより,係り受け制約を生成規則として表現した確率文脈自由文法を用いる解析が考えられる.しかし,詳細な係り受け制約を記述すると,生成規則数が膨大となり,最尤推定による高信頼度のパラメタ推定値を得るために必要な学習データを収集することが困難となる.本稿では,このような確率文法のパラメタ推定法として,ほとんどの場合に最尤推定量より平均的に誤差が小さく,学習データが十分でない場合により有効となる推定量を提案し,英語の前置詞句の係り先の判定を対象として行なった評価実験について報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We can disambiguate syntactic structures of a sentence based on a Probabilistic Context Free Grammar (PCFG), where syntactic categories are subdivided semantically so that dependency constraints are expressed in the productioon rules. But to describe dependency constraints in detail causes an explosion of the number of production rules, which makes it difficult to collect enough size of sample to get a reliable maximum likelihood estimate of parameters in the PCFG. This paper proposes a new estimator of parameters in the PCFG and show the result of an experiment in disambiguation of English prepositional phrase attachment. The mean error of the proposed estimator is practically smaller than the one of the maximum likelihood estimator, and this tendency is more conspicuous on a small size of sample. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1998, 号 63(1998-NL-126), p. 39-46, 発行日 1998-07-23 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |