WEKO3
アイテム
言語情報と字形情報を用いた近代書籍に対するOCR誤り訂正
https://ipsj.ixsq.nii.ac.jp/records/176220
https://ipsj.ixsq.nii.ac.jp/records/1762209fd424ff-58a0-4cc2-8de2-5fd2483437d3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2016-12-02 | |||||||
タイトル | ||||||||
タイトル | 言語情報と字形情報を用いた近代書籍に対するOCR誤り訂正 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | OCR Error Correction for Early-Modern Printed Books by using both Linguistic Information and Character Form Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | OCR ,デジタルテキスト化,自然言語処理,近代書籍,デジタルアーカイブ | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Research and Development of Higher Education, The University of Tokyo | ||||||||
著者名 |
増田, 勝也
× 増田, 勝也
|
|||||||
著者名(英) |
Katsuya, MASUDA
× Katsuya, MASUDA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究ではOCR 結果に対し言語情報および字形の両方を利用し近代書籍特有のOCR誤りの訂正を行う.近代の書籍に対するOCR処理では字形の違いにより現代の書籍を対象としたOCRシステムでは一部の文字が正しく認識されない.そこで本研究では近代書籍のOCR結果に対し,そのような誤り傾向を考慮したOCR誤り訂正を提案する.各文字の出現に対し,その周辺言語情報みならず対象とするOCR結果全体の中での他の箇所での同じ文字周辺言語情報を利用することで特定の文字の誤り傾向を考慮し訂正を行う.実験結果により,そのような近代書籍特有のOCR誤りが訂正されたことを示す . | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a OCR error correction method for early modern books by using both linguistic information and character form information. In Ocr for early modern book, some characters cannot be recognized correctly becaruse of the difference of character form with that in current books. We correct errors in OCR for early modern books with considering the tendency of errors, which means that a character is misrecognized to the same character in almost all places in th book. in the experimental result, we shows proposed method corrects OCR errors specific to OCR for early modern books. | |||||||
書誌情報 |
じんもんこん2016論文集 巻 2016, p. 57-62, 発行日 2016-12-02 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |