ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. データベースシステム(DBS)※2025年度よりデータベースとデータサイエンス(DBS)研究会に名称変更
  3. 2002
  4. 67(2002-DBS-128)

HTML Table情報のXMLによる統合

https://ipsj.ixsq.nii.ac.jp/records/19437
https://ipsj.ixsq.nii.ac.jp/records/19437
7564c3ed-d999-4265-820d-8e49f3fdcdde
名前 / ファイル ライセンス アクション
IPSJ-DBS02128018.pdf IPSJ-DBS02128018.pdf (250.5 kB)
Copyright (c) 2002 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2002-07-18
タイトル
タイトル HTML Table情報のXMLによる統合
タイトル
言語 en
タイトル The Integration of multiple HTML Table information into one XML List
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学大学院情報理工学系研究科
著者所属
国立情報学研究所
著者所属
東京大学大学院情報理工学系研究科
著者所属(英)
en
Graduate School of Information Science and Technology, University of Tokyo
著者所属(英)
en
National Institute of Informatics
著者所属(英)
en
Graduate School of Information Science and Technology, University of Tokyo
著者名 板井, 久美 高須, 淳宏 安達, 淳

× 板井, 久美 高須, 淳宏 安達, 淳

板井, 久美
高須, 淳宏
安達, 淳

Search repository
著者名(英) Kumi, Itai Atsuhiro, Takasu Jun, Adachi

× Kumi, Itai Atsuhiro, Takasu Jun, Adachi

en Kumi, Itai
Atsuhiro, Takasu
Jun, Adachi

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では、複数のHTMLページに存在し、内容的には類似していても、構造の全くバラバラな表情報を、全て一つの共通のXMLの表構造に変換し、統合する手法について提案する。これにより、独立して存在する表の情報を一覧表とし、一見して、各々の特徴を比較できる。今回は、その中でも、各表の内容を解析することにより、「表構造から情報を抽出」し、「それらを意味によって分類」するというタスクに焦点を当てている。情報の意味による分類方法として、本稿では、(I)Support Vector Machineによる分類、(II)隠れマルコフモデルを用いた表構造推定による分類、という2通りの手法を試み、分類の精度の比較を行った。
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we propose a method of transformation of HTML tables, which have various kinds of structure,into a common XML List Structure. It enables us to browse and compare all information that is in separate HTML pages. This paper focuses on the tasks of information extraction from tables and data categorization. For this purpose, we applied two ways, (I) data classification by using Support Vector Machine and (II) a table structure estimation and data categorization by using Hidden Markov Model, and report the experimental results.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10112482
書誌情報 情報処理学会研究報告データベースシステム(DBS)

巻 2002, 号 67(2002-DBS-128), p. 131-138, 発行日 2002-07-18
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 22:11:59.493879
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3