WEKO3
アイテム
HTML文書からのイベント情報抽出
https://ipsj.ixsq.nii.ac.jp/records/19424
https://ipsj.ixsq.nii.ac.jp/records/19424262d8040-5681-4ca7-afb0-c8013ee65b06
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-07-18 | |||||||
タイトル | ||||||||
タイトル | HTML文書からのイベント情報抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extraction of Event Information from HTML Documents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)両備システムズソフトウェアカンパニー/岡山県立大学情報系工学研究科システム工学専攻 | ||||||||
著者所属 | ||||||||
(株)両備システムズソフトウェアカンパニー/岡山県立大学情報系工学研究科システム工学専攻 | ||||||||
著者所属 | ||||||||
国立詫間電波工業高等専門学校/岡山県立大学情報系工学研究科システム工学専攻 | ||||||||
著者所属 | ||||||||
岡山県立大学情報工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ryobi Systems Corporation, Software Company/Okayama Prefectural University, Graduate course of Information Science and System Engineering | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ryobi Systems Corporation, Software Company/Okayama Prefectural University, Graduate course of Information Science and System Engineering | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Takuma National College of Technology/Okayama Prefectural University, Graduate course of Information Science and System Engineering | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Okayama Prefectural University, Faculty of Information Science and System Engineering | ||||||||
著者名 |
三宅, 新二
× 三宅, 新二
|
|||||||
著者名(英) |
Shinji, Miyake
× Shinji, Miyake
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | HTML文書からイベントに関する情報を抽出するための実現方式と問題点を議論する。イベント情報を抽出するためには、イベント情報の特定、必要項目の特定と抽出、不足項目の補足が必要となる。このために、HTMLの構造情報の解析、タグと値のパターンマッチング、値の変換などを行う。これによって異なった形式で作成された複数のHTML文書からイベント情報を抽出することが可能になる。複数のHTML文書から同一形式でレコードを抽出することにより、HTML情報の利用の可能性を広げる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we describe a method of extracting event information from HTML documents, and discuss some problems involved in the method. In order to extract event information, specification of event information area, specification of required terms and extraction, and supplement of insufficient terms are required. For this reason, analysis of structure information of a HTML document, pattern matching for tag and data area, and conversion of values are performed. Various kinds of event information are extracted from HTML documents. This method increases the availability of HTML information by extracting records in the same form from HTML documents. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2002, 号 67(2002-DBS-128), p. 31-38, 発行日 2002-07-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |