@techreport{oai:ipsj.ixsq.nii.ac.jp:00055066, author = {坪井, 昭憲 and 八村, 広三郎 and 吉村, ミツ and Akinori, Tsuboi and Kozaburo, Hachimura and Mitsu, Yoshimura}, issue = {51(2005-CH-066)}, month = {May}, note = {おもに江戸期に出版された版本をデジタル化した画像から、それぞれの文字を切り出すための手法とその処理結果について報告する。文字切り出しは、汚れやシミの除去、2値化、行の切り出し、ラベリング処理による文字の分離と統合の処理などからなっている。ここでは、2値化の閾値は、基本的に大津の判別分析法によって行うが、頁全体、行単位、さらには局所的な数文字のブロック単位でという風に順次適応的に適用することにより、汚れやシミの影響をあまり受けずに文字切り出しの精度を向上させることができた。各文字の認識は今後の大きな課題であるが、切り出しの結果だけからでも、さらにパターンマッチングなどを利用して、文字の使用頻度を求めたり、版本全体の文字のインデックスを作成したりできると期待される。, This paper describes a method and experimental results of character segmentationfor digitized Japanese historical woodblock-printed books. The methodincludes a removal of stain and smear, binarization, extraction of character linesand extraction of characters by region labelling. The binarization has been done by recursively applying the Otsu's method which realized a good performance of character segmentation eliminating the influence of stain and smears.The result of character segmentation can be utilized, for instance, for making anindex and a dictionary of characters used in the books.}, title = {江戸期版本画像からの文字切り出しの試み}, year = {2005} }