WEKO3
アイテム
隣接グラフを用いた欧文文書画像からの文字列抽出
https://ipsj.ixsq.nii.ac.jp/records/12568
https://ipsj.ixsq.nii.ac.jp/records/125681f146fde-c2d0-4eaf-ac84-bd8d47156ebc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-08-15 | |||||||
タイトル | ||||||||
タイトル | 隣接グラフを用いた欧文文書画像からの文字列抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text - line Extraction from English Document Images Using the Neighbor Graph | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:画像の認識・理解 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 文字列抽出:文書・画像処理のためのビジョン | |||||||
著者所属 | ||||||||
大阪府立大学工学部 | ||||||||
著者所属 | ||||||||
大阪府立大学工学部 | ||||||||
著者所属 | ||||||||
大阪府立大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer and Systems Sciences, College of Engineering, Osaka Prefecture University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer and Systems Sciences, College of Engineering, Osaka Prefecture University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer and Systems Sciences, College of Engineering, Osaka Prefecture University | ||||||||
著者名 |
岩田, 基
× 岩田, 基
|
|||||||
著者名(英) |
Motoi, Iwata
× Motoi, Iwata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では 異なる傾きの文字列を含んだ欧文文書画像から文字列を抽出する手法の1つとして 隣接グラフを用いた手法を提案する. 隣接グラフとは 連結成分の隣接関係を表したグラフである. 本手法では 連結成分の隣接関係の抽出に一般図形ボロノイ図を用いているため 入力文書画像のレイアウトや傾きに依存したパラメータを用いることなく隣接グラフを生成することができる. さらに 欧文文書の文字列は隣接グラフのパスで表現できるため 文字列抽出を 文字列として適切な隣接グラフのパスを求める問題に置き換えることができる. そのようなパスを得るため 本手法では まず 連結成分の大きさ 連結成分間の距離などを基準に文字列の一部として確度の高いパス(シード)を求め 次に 隣接グラフの枝を用いてシードを繰り返し延長するという戦略をとる. シードの延長の際には 近接性 直線性を考慮しつつ接続すべき枝を局所的に選択するため 効率的な処理が実現できる. 文書画像50サンプルを用いて実験を行った結果 文字列抽出率はおよそ90% 処理時間は平均6.82secであり 精度の面では課題が残るものの 効率的には優れていることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a method of text-line extraction which is applicable to documents including various orientations of text-lines. The method is characterized by the use of the neighbor graph, i.e., the representation of adjacency among connected components. The use of the area Voronoi diagram enables us to generate the neighbor graph independently of orientations of text-lines as well as layout of documents. Using the representation, the task of text-line extraction is considered to be the extraction of paths which corresponds to text-lines from the neighbor graph. In order to obtain such paths, the method first extracts parts of text-lines called seeds and then extends them iteratively based on the linearity and proximity between a seed and an edge in the neighbor graph. The extension is based only on local examination of edges so as to reduce the computational cost of the method. As the experimental results for 50 document images, we obtained 90% of text-line extraction rate with 6.82 sec processing time for a page. Although there exist some limitations in accuracy, we have confirmed that the method is flexible and efficient. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 40, 号 8, p. 3239-3248, 発行日 1999-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |