@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00100551, author = {手操, 俊文 and 坪井, 昭憲 and 吉村, ミツ and 八村, 広三郎 and Teguri, Tosifumi and Akinori, Tsuboi and Mitsu, Yoshimura and Kozaburo, Hachimura}, book = {じんもんこん2006論文集}, month = {Dec}, note = {おもに江戸期に出版された版本をデジタル化した画像から,それぞれの文字を切り出すための手法と,その結果を利用したキャラクタスポッティングについて報告する.文字切り出しは,汚れやシミの除去,2値化,行の切り出し,ラベリング処理による文字の分離と統合の処理などからなっている.ここでは,2値化の処理は,頁全体,行単位,さらには局所的な文字のブロック単位でという風に順次適応的に適用することにより,汚れやシミの影響をあまり受けずに文字切り出しの精度を向上させることができた.また切り出しが成功した文字図形に対して,文字図形の類似性に基づくキャラクタスポッティングを行った.特徴量として,画素値と加重方向指数ヒストグラムを用いた場合について検討した.どちらの場合もある程度の結果を得ることができ,これをコンコーダンスやKWICの作成;;へ応用できることを示した., This paper describes methods of character segmentation and character spotting for digitized Japanese historical wood-block-printed books. The segmentation method includes a removal of stain and smear, binarization, extraction of character lines and extraction of characters by region labeling. The binarization has been done by recursively applying the Otsu's method which realized a good performance of character segmentation eliminating the influence of stain and smears. Then the result of character segmentation has been applied to character spotting by using feature vectors derived from each character image. The principal component analysis (PCA) for dimen-;;sionality reduction and the Euclidian distance are used. The significance of the methods are shown by making a KWIC index and a concordance of the characters in the book.}, pages = {117--124}, publisher = {情報処理学会}, title = {江戸期版本画像におけるキャラクタスポッティング}, volume = {2006}, year = {2006} }