2024-03-29T22:26:37Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000093862022-10-21T05:24:51Z00581:00586:00588
大域的情報を用いた日本語固有表現認識Japanese Named Entity Recognition Using Non-local Informationjpn一般論文http://id.nii.ac.jp/1001/00009386/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=9386&item_no=1&attribute_id=1&file_no=1Copyright (c) 2008 by the Information Processing Society of Japan自然言語東京大学大学院情報理工学系研究科 日本学術振興会特別研究員DC京都大学大学院情報学研究科笹野, 遼平黒橋, 禎夫本稿では大域的情報を用いた日本語固有表現認識手法を提案する.提案する手法では,SVMを用いた固有表現認識手法を基とし,構造的な解析などから得られる大域的な情報として,先行文における同一形態素の解析結果,共参照関係にある表現の解析結果,係り先から得られる情報,固有表現情報を付与した格フレームを用いた格解析から得られる情報の4つの情報を新たに導入する.CRL固有表現データ(5分割交差検定),IREXテストセット,および,ウェブテキストに固有表現を付与したデータを用いた評価実験の結果,従来手法より高い精度が得られ,手法の有効性が確認された.This paper presents an approach that uses non-local information for Japanese named entity recognition (NER). Our NER system is based on Support Vector Machine (SVM), and utilizes four types of non-local information: cache features, coreference relations, syntactic features and case-frame features, which are obtained from structural analyses. We evaluated our approach on CRL NE data and obtained a higher F-measure than existing approaches that do not use non-local information. We also conducted experiments on IREX NE data and an NE-annotated web corpus and confirmed that non-local information improves the performance of NER.AN00116647情報処理学会論文誌4911376537762008-11-151882-77642009-06-29