2024-03-29T09:02:07Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000481162023-04-27T10:00:04Z01164:04179:04208:04210
新聞記事からの用語定義の抽出と固有表現クラスに基づく分類Extraction and Classification of Term Definitions Using Named Entity Extraction from News Articlesjpnhttp://id.nii.ac.jp/1001/00048116/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48116&item_no=1&attribute_id=1&file_no=1Copyright (c) 2004 by the Information Processing Society of Japan(株)東芝研究開発センター知識メディアラボラトリー(株)東芝研究開発センター知識メディアラボラトリー(株)東芝研究開発センター知識メディアラボラトリー小山, 誠酒井, 哲也真鍋, 俊彦本報告では,質問応答システムなどの自然言語処理システムの言語知識の拡張のため,新聞記事から用語定義を抽出し,分類・体系化するシステムを提案する.本システムは,定義文に対する固有表現抽出結果から得られる固有表現の意味クラスと,定義文に対する形態素解析結果から抽出される語に基づき,用語定義を分類する.新聞記事を用いた評価実験を行った結果,14の意味クラスに対して,適合率82.1%,再現率50.8%で抽出した用語定義を分類できることを確認した.In this paper, we propose a system that uses Japanese newspaper corpora for extracting and classifying term definitions to expand the knowledge of a natural language system such as a question answering system. The system classifies term definitions based on semantic classes obtained through named entity extraction and words obtained through morphological analysis. In an experiment using news articles, the system classifies term definitions by 14 semantic classes and achieves 82.1% precision and 50.8% recall.AN10115061情報処理学会研究報告自然言語処理(NL)200493(2004-NL-163)45512004-09-162009-06-30