2024-03-28T21:01:06Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000481222023-04-27T10:00:04Z01164:04179:04208:04210
Machine Learning - based Dependency Analyzer for Chinese機械学習に基づく決定性の中国語依存構造解析器enghttp://id.nii.ac.jp/1001/00048122/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48122&item_no=1&attribute_id=1&file_no=1Copyright (c) 2004 by the Information Processing Society of Japan奈良先端科学技術大学院大学 情報科学研究科奈良先端科学技術大学院大学 情報科学研究科奈良先端科学技術大学院大学 情報科学研究科鄭育昌浅原, 正幸松本, 裕治本研究では、機械学習に基づく決定性の中国語依存構造解析器を実装する。依存構造解析アルゴリズムとして山田モデルとNivreモデルを用いて実装し、構造を判別する機械学習器として最大エントロピー法とSVM法を用いた。本稿では、CKIP treebankを用いて各モデルの有効性について比較検証する。実験結果によると、Nivreモデルは山田モデルで残されている曖昧性を解決できる。その他、中国語に存在する多様な複合名詞問題に対して、chunkerを用いた複合名詞抽出による精度向上についても検討する。In this paper, we present a deterministic dependency structure analyzer for Chinese. This analyzer implements two algorithms ? Yamada and Nivre model ? and two sorts of classifier ? SVMs and MaxEnt. We compare the performance of two algorithms (by Yamada and by Nivre). We evalu-ate the method on a dependency tagged corpus derived from the CKIP Treebank corpus. The result shows that Nivre’s algorithm can resolve some problems in Yamada’s algorithm. Then we try to add NP-chunker in our analyzer. Although the result of NP-chunker experiment doesn’t show signifi-cantly better performance, we discuss that using NP-chunker is necessary for Chinese dependency analyzing. AN10115061情報処理学会研究報告自然言語処理(NL)200493(2004-NL-163)91982004-09-172009-06-30