WEKO3
アイテム
非定型 Web コンテンツ管理のための軽量ラッピング言語
https://ipsj.ixsq.nii.ac.jp/records/18835
https://ipsj.ixsq.nii.ac.jp/records/18835ecc542fc-fa6b-47bb-b7b2-550a8e663150
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-07-04 | |||||||
タイトル | ||||||||
タイトル | 非定型 Web コンテンツ管理のための軽量ラッピング言語 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Lightweight Wrapping Language for the Management of Non-Template-Based Web Contents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. Sch. of Info, and Media Studies, Univ. of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. Sch. of Info, and Media Studies, Univ. of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. Sch. of Info, and Media Studies, Univ. of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Grad. Sch. of Sys. and Info. Eng., Univ. of Tsukuba | ||||||||
著者名 |
澤, 菜津美
× 澤, 菜津美
|
|||||||
著者名(英) |
Natsumi, SAWA
× Natsumi, SAWA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、HTML で記述された Web コンテンツから構造データを抽出するためのラッピング言語 Parselet を提案する。Parselet は、特に非定型 Web コンテンツから、構造データを抽出する事を考慮して設計されたものである。そのため、人手による規則の記述が容易になるよう、簡易な構文やライブラリの工夫を行っている。本稿では、Parselet 開発の動機と設計について述べ、実 Web サイトへの適用可能性に関する予備実験の結果を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes Parselet, a wrapping language for extracting structured data from Web contents written in HTML. Parselet is designed especially for extracting structured data from non-template-based Web pages and for maintaining the content integrities among such Web pages. Its simple syntax and the library of useful patterns help the user write wrapping descriptions by hand. This paper explains the motivation of its development and the language design and then shows the result of a preliminary experiment about applicability of the language to real Web sites. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2007, 号 65(2007-DBS-143), p. 527-532, 発行日 2007-07-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |