WEKO3
アイテム
ECサイトからの商品情報抽出ルールの自動生成
https://ipsj.ixsq.nii.ac.jp/records/80111
https://ipsj.ixsq.nii.ac.jp/records/80111e76919f0-92d8-4f9e-9206-b67601aca321
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-01-13 | |||||||
タイトル | ||||||||
タイトル | ECサイトからの商品情報抽出ルールの自動生成 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic rule generation for extract information from E-commerce Web Page | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Web応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話株式会社NTTサイバーソリューション研究所 | ||||||||
著者所属 | ||||||||
京都大学大学院大学院情報学研究科 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTサイバーソリューション研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTサイバーソリューション研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Solutions Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Solutions Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Solutions Laboratories, NTT Corporation | ||||||||
著者名 |
飯村, 結香子
× 飯村, 結香子
|
|||||||
著者名(英) |
Yukako, Iimura
× Yukako, Iimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ECサイトの商品説明ページから,商品名や価格情報,商品説明文等の商品情報を自動で抽出する商品情報抽出ルールの自動生成ついて提案する.ECサイトで商品説明ページの定型性を利用し.複数のページ間を比較したときに,共通な部分と変化する部分を分離する.商品属性ごとに変化する部分を抽出位置の候補として,その部分から抽出される値の特徴およびその部分の周辺の固定の特徴からその出現位置候補が商品情報の抽出位置であるか否かを判定する.商品属性ごとに定義された属性値抽出箇所を,その商品説明ページの商品情報抽出ルールとする.提案手法を実装し抽出実験と評価を行い一定の有効性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose an automatic rule generation methods in order to extract commodity information from the E-commerce sites. The commodity explanation pages are composed by both the changing parts and the fixed parts, and the commodity information is expected in the changing parts. Besides, the types of the information such that item name, price, etc. are to be estimated by using the peripheral features. We made a prototype of our method and applied to real E-commerce sites pages, and the experimental results show definite effectiveness of our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報基礎とアクセス技術(IFAT) 巻 2012-IFAT-105, 号 13, p. 1-7, 発行日 2012-01-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |