WEKO3
アイテム
MSLRパーザにおける未定義語処理の一検討
https://ipsj.ixsq.nii.ac.jp/records/131144
https://ipsj.ixsq.nii.ac.jp/records/13114489a83f78-6259-49cb-a4ea-23be241476cc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-03-12 | |||||
タイトル | ||||||
タイトル | MSLRパーザにおける未定義語処理の一検討 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | A study of unknown word processing in MSLR parser | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
(株)日本電子化辞書研究所 | ||||||
著者所属 | ||||||
東京工業大学 | ||||||
著者所属 | ||||||
三菱電機(株) | ||||||
著者所属 | ||||||
(株)日本電子化辞書研究所 | ||||||
著者所属 | ||||||
東京工業大学 | ||||||
著者所属(英) | ||||||
en | ||||||
Japan Electronic Dictionary Research Institute, LTD. | ||||||
著者所属(英) | ||||||
en | ||||||
Tokyo Institute of Technology | ||||||
著者所属(英) | ||||||
en | ||||||
Mitsubishi Electric Corporation. | ||||||
著者所属(英) | ||||||
en | ||||||
Japan Electronic Dictionary Research Institute, LTD. | ||||||
著者所属(英) | ||||||
en | ||||||
Tokyo Institute of Technology | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 文脈自由文法(CFG)モデルに基づく自然言語の解析手法について、文法記述の明確性と高速性の両立を期待する観点で、これまで多くの研究がされている。それらの中でも、一般化LR (GLR)法は、処理効率、及び拡張性の面で優れている。また、形態素解析と統語解析を統合したMSLRパーザが知られている。しかし、GLR法における日本語を対象とした未定義語処理は、あまり研究されていない。斎藤は、GLR法を用いて、エラーにより解析が行き詰まった場合にカテゴリの置換、挿入、及び読み飛ばしにより解析を続行する方式を提案した。エラーが起きない場合でも、非終端記号を仮定するギャップ埋め処理を提案している。しかし、この方式は、試行しなければならない場合の数が非常に増大する危険がある。今井は解析が失敗した場合にステージを以前に reduceした時点まで戻して処理する方式を提案している。しかし、今井の対象は英語である。英語の場合、未定義語の存在範囲が明確であるが、日本語の場合は、単語そのものの境界が不明確なため、未定義語の混入が誤った単語切り出しを招く可能性もあり、より大きな問題になる。この解決手法は明らかになっていない。GLR法に基づく日本語解析の未定義語処理の研究として植木がある。これは、字種の情報を用いて、未定義の固有名詞を推定するものである。この方式は固有名詞の処理に関して一定の成功を得ているが、他の多くの未定義語出現の場合にも対応しなければならない。そこで我々は、GLR法に対する未定義語処埋の一般的な枠組を得るという目的と、未定義語獲得にコーパス上での統計的処理を適用し、その統計的処理とCFGモデルに基づく自然言語パーザの処理を融合的に行なう手法を確立するという目的で研究を行なっている。本稿では、MSLRパーザをべースとして、EDR日本語辞書とEDR日本語コーパスを利用した実験を行ない、手法の有効性についで確認をしたので報告する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第54回, 号 人工知能と認知科学, p. 71-72, 発行日 1997-03-12 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |