{"created":"2025-01-19T00:05:58.293498+00:00","metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00126301","sets":["6504:8067:8071"]},"path":["8071"],"owner":"1","recid":"126301","title":["文書OCRにおける出力テキストの整形方法"],"pubdate":{"attribute_name":"公開日","attribute_value":"1994-09-20"},"_buckets":{"deposit":"cdfd8559-9251-4094-8616-c9fae0d03b90"},"_deposit":{"id":"126301","pid":{"type":"depid","value":"126301","revision_id":0},"owners":[1],"status":"published","created_by":1},"item_title":"文書OCRにおける出力テキストの整形方法","author_link":[],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"文書OCRにおける出力テキストの整形方法"},{"subitem_title":"A method for formatting OCR texts","subitem_title_language":"en"}]},"item_type_id":"22","publish_date":"1994-09-20","item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_22_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"日本アイ・ビー・エム株式会社東京基礎研究所"}]},"item_22_text_4":{"attribute_name":"著者所属(英)","attribute_value_mlt":[{"subitem_text_value":"IBM Rescarch,Tokyo Research Labortory,IBBM Japan Ltd","subitem_text_language":"en"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/126301/files/KJ00001339780.pdf"},"date":[{"dateType":"Available","dateValue":"1994-09-20"}],"format":"application/pdf","filename":"KJ00001339780.pdf","filesize":[{"value":"189.7 kB"}],"mimetype":"application/pdf","accessrole":"open_date","version_id":"20c933ba-258d-4aaa-8531-c62f6b8c043c","displaytype":"detail","licensetype":"license_note"}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_5794","resourcetype":"conference paper"}]},"item_22_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN00349328","subitem_source_identifier_type":"NCID"}]},"item_22_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"印刷文書用OCRシステムを用いて文書を認識した後に、その処理結果を有効利用するために、認識結果をどのような形態で出力するのがよいかというのは大きな問題である。また、認識しながら、あるいは認識が終了した後に、認識結果を確認修正する場合に、どのような形態で表示すればより効率的な確認修正ができるかということもシステム全体から見て重要である。認識した文字をテキストファイルとして出力するのがもっとも一般的な方法であると考えられるが、そのテキストファイルでの出力の従来の方法として(1)文字を認識した順に、上から文字列単位で出力する方法、と(2)オリジナルイメージのレイアウトをできるだけ再現して出力する方法、がある。(1)も(2)もそれぞれ認識結果を利用する際には有用な表現形式である。特に、(2)の方法では確認修正の際にオリジナル文書と比較がしやすい等の利点を持つ。従来は、(2)を実現するために文字の座標情報から位置を計算してその位置に文字を表示するという方法で実現していた。しかし、この方法は複数カラムをもつドキュメントを処理した場合などに第2カラム目以降の左端がそろわないなどの問題点をもっている。この問題点の原因としては、座標から文字数を計算する時の誤差、オリジナル文書とテキストファイルとで文字ピッチ、行ピッチ、フォントサイズ等が異なるということがあげられる。そこで本稿では、従来(2)の方法で生じていた問題点を解決するために文字認識に先だって行なわれるレイアウト解析の結果を利用して認識された文字を整形して出力する方法を示す。","subitem_description_type":"Other"}]},"item_22_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"198","bibliographic_titles":[{"bibliographic_title":"全国大会講演論文集"}],"bibliographicPageStart":"197","bibliographicIssueDates":{"bibliographicIssueDate":"1994-09-20","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"人工知能及び認知科学","bibliographicVolumeNumber":"第49回"}]},"relation_version_is_last":true,"weko_creator_id":"1"},"links":{},"id":126301,"updated":"2025-01-21T01:48:05.637195+00:00"}