WEKO3
アイテム
図表検索のための図表情報自動抽出の試み
https://ipsj.ixsq.nii.ac.jp/records/43164
https://ipsj.ixsq.nii.ac.jp/records/4316423f83f7d-446b-4b05-8729-9efccd53504c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-03-15 | |||||||
タイトル | ||||||||
タイトル | 図表検索のための図表情報自動抽出の試み | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Experiment in Automatic Extraction of Chart Information for Chart Retrieval | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
TIS(株)産業第2事業部 マルチメディアビジネス第1部 先端技術グループ | ||||||||
著者所属 | ||||||||
TIS(株)産業第2事業部 マルチメディアビジネス第1部 先端技術グループ | ||||||||
著者所属 | ||||||||
TIS(株)産業第2事業部 マルチメディアビジネス第1部 先端技術グループ | ||||||||
著者所属 | ||||||||
TIS(株)産業第2事業部 マルチメディアビジネス第1部 先端技術グループ | ||||||||
著者所属 | ||||||||
関西電力(株)総合技術研究所 情報通信研究室 | ||||||||
著者所属 | ||||||||
関西電力(株)総合技術研究所 情報通信研究室 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Multimedia Business Dept.1, Industrial Business Div.2, TIS Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Multimedia Business Dept.1, Industrial Business Div.2, TIS Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Multimedia Business Dept.1, Industrial Business Div.2, TIS Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Multimedia Business Dept.1, Industrial Business Div.2, TIS Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Technical Research Center, The Kansai Electric Power Co., Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Technical Research Center, The Kansai Electric Power Co., Inc. | ||||||||
著者名 |
市野, 順子
× 市野, 順子
|
|||||||
著者名(英) |
Junko, Ichino
× Junko, Ichino
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,様々な形式の電子文書が普及し,蓄積されている.しかし,それらの再利用や検索についてはあまり考慮されていない.本研究では,文書中の図表に着目し,様々な形式の電子文書から図表領域を特定し,図表に関連する様々な情報を網羅的に抽出することを目指す.本稿では図表領域及び,図表に関連するテキスト情報を抽出する手法について述べる.提案手法はルールベースを基本としている.11文書90図表を対象に抽出を行ったところ,図表領域の特定は,再現率97%,適合率80%,キャプション,本文図表説明文の抽出は,それぞれ3位適合率85%,3位適合率90%の結果を得た. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Although electronic documents have come into wide use and a mass of data is stored, reuse or retrieval of these documents has not been considered much. In this study, focusing on the charts in documents, we attempt to specify chart areas and extract information about charts from electronic documents in various forms. In this paper, the method of extraction of chart areas and text information is examined. The algorithm is based on rules. An experiment in the validity of chart retrieval was made on 11 documents and 90 charts, and the results show: recall 97% and precision 80% in specifying chart areas; and precision (3-CUTOFF) 85% and 90% in extracting captions and chart explanations respectively. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10539261 | |||||||
書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2002, 号 28(2001-DD-032), p. 143-150, 発行日 2002-03-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |