WEKO3
アイテム
古文書画像の標題文字セグメンテーション
https://ipsj.ixsq.nii.ac.jp/records/99954
https://ipsj.ixsq.nii.ac.jp/records/999540ff3c04c-c69f-4660-b6f8-d77d13df680d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-12-15 | |||||||
タイトル | ||||||||
タイトル | 古文書画像の標題文字セグメンテーション | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Title Character Segmentation for Historical Document Images | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
立命館大学 | ||||||||
著者所属 | ||||||||
大阪市立大学 | ||||||||
著者所属 | ||||||||
国際日本文化研究センター | ||||||||
著者所属 | ||||||||
立命館大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Osaka City University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
lnternational Research Center for Japanese Studies | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Ritsumeikan University | ||||||||
著者名 |
尾崎, 浩司
× 尾崎, 浩司
|
|||||||
著者名(英) |
Kouji, Ozaki
× Kouji, Ozaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 古文書の文字切り出し、及び文字認識の基礎的研究を行うために、古文書の標題のみを対象とした文字パターン辞書の構築と関連するユーザインターフェイスの開発を行っている。本稿では、古文書の原画像から抽象化された概略画像を抽出し、その概略画像上での標題の抽出、及びレイアウトを認識する手法と、標題文字のセグメンテーションについて述べる。標題の抽出では、概略画像より射影ヒストグラム法、及びラベリング法の併用による手法を試みた。実験結果では、994文書中約78.1%が正しく抽出された。これらの特徴と問題点について考察する。レイアウトの認識では、標題、本文、日付、差出人、受取人等を認識するルール、及びその実現する手法について考察する。また、標題文字のセグメンテーションでは、文字パターン辞書を用いて、テンプレートマッチングによる切出しと認識を試みた。実験結果では、10標題、97文字中約84.5%の割合でマッチングに成功した。これらの特徴と問題点についても考察する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As a part of an ongoing research on character segmentation and recognition for historical documents, we have developed a character pattern dictionary focused on title of historical document and an user interface for segmenting characters. This paper describes the generation of outline image, extraction and segmentation of title, and layout recognition for the images. In the title extraction, both histogram projection and labeling methods are used. The ratio of accuracy in extraction is estimated to be 78.1% for 994 documents. In the layout recognition, a rule for identifying title, body, date, sender, and receiver of each document, and a method for implementation is discussed. For each character segmentation and recognition using the template matching, the ratio of recognition was 84.5% for 97 characters in 10 titles. | |||||||
書誌情報 |
じんもんこん2000論文集 巻 2000, 号 17, p. 279-286, 発行日 2000-12-15 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |