WEKO3
アイテム
日本語印刷文書における文字切り出し -新聞自動読み取りへの応用-
https://ipsj.ixsq.nii.ac.jp/records/16050
https://ipsj.ixsq.nii.ac.jp/records/1605085bbd52c-24bb-4f9d-b4e0-da4aa05939ef
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1983 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Journal(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1983-07-15 | |||||||
| タイトル | ||||||||
| タイトル | 日本語印刷文書における文字切り出し -新聞自動読み取りへの応用- | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Segmentation of Machine Printed Japanese Text - Its Application to a Newspaper Reader | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 大阪大学基礎工学部情報工学科/現在 大阪大学産業科学研究所 | ||||||||
| 著者所属 | ||||||||
| 大阪大学基礎工学部情報工学科/現在 シャープ(株) | ||||||||
| 著者所属 | ||||||||
| 大阪大学基礎工学部情報工学科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Science, Faculty of Engineering Science, Osaka University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Science, Faculty of Engineering Science, Osaka University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Department of Information and Computer Science, Faculty of Engineering Science, Osaka University | ||||||||
| 著者名 |
豊田, 順一
野口, 要治
西村, 康
× 豊田, 順一 野口, 要治 西村, 康
|
|||||||
| 著者名(英) |
Junichi, Toyoda
Yohji, Noguchi
Yasushi, Nishimura
× Junichi, Toyoda Yohji, Noguchi Yasushi, Nishimura
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文は 日本語印刷文書における文字切り出し手法について述べたものである.日本語印刷文書では 1行あたりの文字数を文字増やしたり 減らしたりすることがしばしば行われる.これは 追い込み 追い出し操作と呼ばれるものであり 文字ピッチが大きく乱れる原因となっている.したがって 黒画素の一次元射影を調べ 文字ピッチが一定であるという先験的知識のみに依存して文字切り出しを行う従来の手法では 文字切り出しの成功率は低いと思われる.著者らの手法は まず文字ピッチの乱れを検出し さらにそれが追い込み あるいは追い出し操作によるものか否かを判定する.もしそうであれば それらの操作が行われた場合の文字配置に関する知識を利用して 文字切り出しを行う.このような知識の利用とともに 従来の画素単位の処理に加えて 処理の早い段階から 1文字に相当する画素の集合を処理の単位とするために 新たに8連結ブロックと呼ぶ黒画素の集合を定義し 8連結ブロックの大小とそれらの相対的位置関係を利用して文字切り出しを行う点に大きな特徴がある.著者らは 新聞などの自動読み取りシステムについて研究中であり この手法は そのシステムの一部分として新聞を対象に開発したが 新聞に限らず他の日本語印刷文書にも十分適用できると考えられる. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN00116647 | |||||||
| 書誌情報 |
情報処理学会論文誌 巻 24, 号 4, p. 481-487, 発行日 1983-07-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7764 | |||||||