WEKO3
アイテム
表構造の一般化に基づくオントロジの獲得
https://ipsj.ixsq.nii.ac.jp/records/10304
https://ipsj.ixsq.nii.ac.jp/records/103040d18a5de-a4ac-421d-b1e6-96484b741f06
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-05-15 | |||||||
タイトル | ||||||||
タイトル | 表構造の一般化に基づくオントロジの獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Ontology Extraction Based on Generalization of Table Structure | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | データマイニング・データウェアハウス | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科社会情報学専攻 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科社会情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics, Kyoto University | ||||||||
著者名 |
田仲, 正弘
× 田仲, 正弘
|
|||||||
著者名(英) |
Masahiro, Tanaka
× Masahiro, Tanaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 表からの情報抽出に関する従来の研究は,表の認知モデルなど表構造の先見的知識や,対象ドメインの語彙の知識ベースを用いるものであった.しかし幅広くWeb から集められた表を対象とする場合には,同じ表構造に対して表ごとに違う解釈をしたり,様々なドメインの表を処理したりする必要がある.本研究では,表構造が表すデータ間の関係の解釈で与え,形式化された表構造とその構造が表すデータの関係との対応を得ることで,表形式データからオントロジを構築する手法を提案する.人手により解釈を与えられた構造を,セルの隣接関係や繰返し構造に注目して自動的に一般化することにより,表中のデータ間の関係を得る.Web 上の価格表・タイムテーブル・統計データなどの表に対し提案手法を適用した結果,少ないコストで表中のデータの関係を記述する多くのRDF ステートメントが得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Previous works on information extraction from tables make use of lexical knowledge bases of tables or prior knowledge such as a cognition model of tables. However, we often need to interpret table structures in each table differently and to treat lexicons in various domains for processing a broad range of tables on the Web. The method proposed in this paper extracts an ontology from a table by using relations represented by structures. Once the interpretations of table structures are given by humans, the table structures are automatically generalized to extract relations from the whole table. We defined a formal representation of generalized table structure based on the adjacency of cells and iterative structures. Our experiments showed that the method extracted class-hierarchies, property-value pairs and other various relations from the tables containing price lists, timetables and statistics on the Web. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 47, 号 5, p. 1530-1537, 発行日 2006-05-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |