2024-03-30T00:59:26Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000481992024-03-29T05:26:34Z01164:04179:04208:04214
サポートベクトルマシンを用いたプロフィール情報の抽出Extraction of Profile Information Using Support Vector Machinesjpnhttp://id.nii.ac.jp/1001/00048199/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48199&item_no=1&attribute_id=1&file_no=1Copyright (c) 2004 by the Information Processing Society of Japan大阪府立大学大学院工学研究科情報工学分野大阪府立大学大学院工学研究科情報工学分野大阪府立大学大学院工学研究科情報工学分野吉谷, 仁志黄瀬浩一松本, 啓之亮固有表現抽出および情報統合の技術を用いて,電子文書から表形式のプロフィール情報を作成する手法を提案する.固有表現抽出で得られる情報は単語が主であり,単独で有用な情報となることがそれほど多くない.また,従来の情報統合では人手によりあらかじめ作成された表を対象としているものが多く,電子文書の持つ膨大な情報を十分に生かしきれているとはいえない.本研究では,以下に示す手順で電子文書から表形式の情報を作成する手法を紹介する.まず,サポートベクトルマシンを用いて固有表現抽出及びプロフィール情報を表形式化する.次に,それらを氏名の一致により統合する.手法の有効性を確認するために新聞記事1ヶ月分を対象として実験を行った結果,値で0.56程度の結果が得られた.This report presents a method for extracting profile information in tabular formats based on existing technologies called named entity extraction and information integration. Named entity extraction enables us to provide elements of tables for profile information. Information integration allows us to unify tables for making the profile information fruitful, though it requires predetermined initial tables. In this report, we propose a whole system of extracting profile information by bridging the gap between the two technologies. For this purpose we employ a method of grouping named entities for making initial tables.For the extraction and grouping of named entities we utilize support vector machines. Initial tables are then unified using if these are with the same name. From the experimental results on newspaper articles for one month, we obtained the results of F = 0.56.AN10115061情報処理学会研究報告自然言語処理(NL)20041(2003-NL-159)7122004-01-132009-06-30