@techreport{oai:ipsj.ixsq.nii.ac.jp:00080125, author = {飯村, 結香子 and 真鍋, 知博 and 塩原, 寿子 and 内山, 匡 and Yukako, Iimura and Tomohiro, Manabe and Hisako, Shiohara and Tadasu, Uchiyama}, issue = {13}, month = {Jan}, note = {ECサイトの商品説明ページから,商品名や価格情報,商品説明文等の商品情報を自動で抽出する商品情報抽出ルールの自動生成ついて提案する.ECサイトで商品説明ページの定型性を利用し.複数のページ間を比較したときに,共通な部分と変化する部分を分離する.商品属性ごとに変化する部分を抽出位置の候補として,その部分から抽出される値の特徴およびその部分の周辺の固定の特徴からその出現位置候補が商品情報の抽出位置であるか否かを判定する.商品属性ごとに定義された属性値抽出箇所を,その商品説明ページの商品情報抽出ルールとする.提案手法を実装し抽出実験と評価を行い一定の有効性を確認した., We propose an automatic rule generation methods in order to extract commodity information from the E-commerce sites. The commodity explanation pages are composed by both the changing parts and the fixed parts, and the commodity information is expected in the changing parts. Besides, the types of the information such that item name, price, etc. are to be estimated by using the peripheral features. We made a prototype of our method and applied to real E-commerce sites pages, and the experimental results show definite effectiveness of our method.}, title = {ECサイトからの商品情報抽出ルールの自動生成}, year = {2012} }