WEKO3
アイテム
HTML Table情報のXMLによる統合
https://ipsj.ixsq.nii.ac.jp/records/19437
https://ipsj.ixsq.nii.ac.jp/records/194377564c3ed-d999-4265-820d-8e49f3fdcdde
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2002-07-18 | |||||||
| タイトル | ||||||||
| タイトル | HTML Table情報のXMLによる統合 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | The Integration of multiple HTML Table information into one XML List | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 東京大学大学院情報理工学系研究科 | ||||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属 | ||||||||
| 東京大学大学院情報理工学系研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science and Technology, University of Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science and Technology, University of Tokyo | ||||||||
| 著者名 |
板井, 久美
高須, 淳宏
安達, 淳
× 板井, 久美 高須, 淳宏 安達, 淳
|
|||||||
| 著者名(英) |
Kumi, Itai
Atsuhiro, Takasu
Jun, Adachi
× Kumi, Itai Atsuhiro, Takasu Jun, Adachi
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本稿では、複数のHTMLページに存在し、内容的には類似していても、構造の全くバラバラな表情報を、全て一つの共通のXMLの表構造に変換し、統合する手法について提案する。これにより、独立して存在する表の情報を一覧表とし、一見して、各々の特徴を比較できる。今回は、その中でも、各表の内容を解析することにより、「表構造から情報を抽出」し、「それらを意味によって分類」するというタスクに焦点を当てている。情報の意味による分類方法として、本稿では、(I)Support Vector Machineによる分類、(II)隠れマルコフモデルを用いた表構造推定による分類、という2通りの手法を試み、分類の精度の比較を行った。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In this paper, we propose a method of transformation of HTML tables, which have various kinds of structure,into a common XML List Structure. It enables us to browse and compare all information that is in separate HTML pages. This paper focuses on the tasks of information extraction from tables and data categorization. For this purpose, we applied two ways, (I) data classification by using Support Vector Machine and (II) a table structure estimation and data categorization by using Hidden Markov Model, and report the experimental results. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2002, 号 67(2002-DBS-128), p. 131-138, 発行日 2002-07-18 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||