2024-03-28T23:08:44Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000487392023-04-27T10:00:04Z01164:04179:04243:04246
広告の自動構造化Automatic Structuring of Advertisement Textsjpnhttp://id.nii.ac.jp/1001/00048739/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48739&item_no=1&attribute_id=1&file_no=1Copyright (c) 1999 by the Information Processing Society of JapanNTT情報流通プラットフォーム研究所NTT情報流通プラットフォーム研究所NTT情報流通プラットフォーム研究所井上, 香織横路, 誠司高橋, 克巳WWW上の広告情報を効率的に検索するための,自動構造化を目的として,不定型な広告文書内の情報に自動的に属性を付与する方式を研究している.今回,「店・企業名」と「業種」属性について,外部知識から構築した辞書を利用した抽出を行なった.本方式は辞書中単語との完全一致マッチングを基本としているが,辞書のもれを拾うために,識別子マッチングを併用した.店・企業名を表す識別子は,店・企業名データから接頭語,接尾語を切り出して作成した.その結果,辞書マッチングでは見落としていた属性のうち27%の属性値を拾うことができた.It's necessary to retrieve data efficiently from large heterogeneous collection of text on the WWW. Our purpose is to establish an automatic structuring method of advertisements texts. We have tried to give attributes to each information in advertisement texts. In this paper, we gave "shop and company name" attributes and "category of business" attributes using the dictionary made with outside knowledge. In order to cover omissions of dictionary matching, our method used distinctive labels to get attribute's values. As a result, label matching could give 27% attributes which could not be given by strict dictionary matching.AN10115061情報処理学会研究報告自然言語処理(NL)199962(1999-NL-132)33391999-07-222009-06-30