WEKO3
アイテム
高次情報を利用した数式文字認識の誤り訂正法の一検討
https://ipsj.ixsq.nii.ac.jp/records/52223
https://ipsj.ixsq.nii.ac.jp/records/522238d19ead8-0567-41c1-91fa-6ada10c553f2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-03-16 | |||||||
タイトル | ||||||||
タイトル | 高次情報を利用した数式文字認識の誤り訂正法の一検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Study on Character Recognition Error Correction Method for Mathematical Formulae using Higher Level Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学大学院情報生産システム研究科 | ||||||||
著者所属 | ||||||||
早稲田大学大学院情報生産システム研究科 | ||||||||
著者所属 | ||||||||
中部大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chubu univ. | ||||||||
著者名 |
瀧口, 祐介
× 瀧口, 祐介
|
|||||||
著者名(英) |
Yusuke, TAKIGUCHI
× Yusuke, TAKIGUCHI
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々の研究室では印刷数式の知的二次利用を目的とした、オフライン数式認識理解システム(以下、本システム)の開発を進めている。本システムには、数式構成記号の文字認識を行う低次認識と、数式の二次元的な構造の認識と数学的な意味の理解を行う高次認識の二つの認識過程が含まれる。本論文では、その高次認識過程における文字認識の誤り訂正法を提案する。提案手法では文字認識と数式と構造認識の結果に基づいてコストツリーを生成し、数式に現れるキーワードと隣接する文字の共起確率の2種類の情報を利用することで、文字の誤認識を訂正する。提案手法の有効性を確かめるために幾つかの数式画像を用いて実験を行った結果、記号単位の文字認識率が79.8%から90.2%に、また数式単位の認識率が5.8%から41.1%に改善されることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper we propose a method for correcting character recognition errors at the higher level recognition step of the mathematical formulae recognition and understanding system. The system consists of two-level recognition steps: the low level recognition including character recognition, and the higher level recognition including layout recognition. We apply the layout information recognized in the latter step, and character recognition errors are corrected by using two sources of information. One is by some keywords such as mathematical function names, and the other is based on a cost tree and co-occurrence probabilities between symbols. Availability of the proposed method is indicated by some experimental results, and the character recognition rate raised from 79.8% to 90.2% and the formula recognition rate raised from 5.8% to 41.1% are confirmed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11131797 | |||||||
書誌情報 |
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2006, 号 25(2006-CVIM-153), p. 107-112, 発行日 2006-03-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |