WEKO3
アイテム
データクリーニングを統合した情報抽出システムの提案
https://ipsj.ixsq.nii.ac.jp/records/18935
https://ipsj.ixsq.nii.ac.jp/records/18935e2ecb4ef-4e76-4e0a-afa7-cf4c56fd1b40
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-07-14 | |||||||
タイトル | ||||||||
タイトル | データクリーニングを統合した情報抽出システムの提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Proposal of Information Extraction System with Data Cleaning Facility | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学情報連携基盤センター | ||||||||
著者所属 | ||||||||
筑波大学システム情報工学研究科コンピュータサイエンス専攻 | ||||||||
著者所属 | ||||||||
筑波大学システム情報工学研究科コンピュータサイエンス専攻 | ||||||||
著者所属 | ||||||||
筑波大学システム情報工学研究科コンピュータサイエンス専攻 筑波大学計算科学研究センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information Technology Center, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer Science, Graduate School of Systems and Information Engineering, University of Tsukuba,Center for Computational Sciences, University of Tsukuba | ||||||||
著者名 |
石川, 佳治
× 石川, 佳治
|
|||||||
著者名(英) |
Yoshiharu, Ishikawa
× Yoshiharu, Ishikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ウェブなどの大量のテキスト情報源から有用な情報を取得するための情報抽出は,データ工学における重要な研究課題の一つとなっている.有用な情報抽出のためには,抽出結果に含まれる誤りやノイズを削減することが求められる.そこで,本研究では情報抽出にデータクリーニングを統合し,ユーザによる対話的なフィードバックを利用することにより,精度の高い情報抽出システムの提案を行う.ブートストラップ型のレコード抽出手法の処理プロセスにデータクリーニング処理も含め,ユーザからのフィードバックを抽出レコードや抽出パターンの評価に反映させる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Information extraction to acquire useful information from a large amount of text sources such as Web is one of the important research topics in data engineering. For useful information extraction, errors and noises included in extraction results should be reduced. In this paper, we propose an approach to an information extraction system with high accuracy by integrating data cleaning into information extraction and using interactive feedbacks from users. The approach is based on the bootstrap record extraction method and includes data cleaning in the process of record extraction. User feedbacks are reflected in the evaluation of the extracted records and the extraction patterns. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2006, 号 78(2006-DBS-140), p. 399-406, 発行日 2006-07-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |