@techreport{oai:ipsj.ixsq.nii.ac.jp:00145128, author = {岩田, 彩 and 上坂, 和美 and 粟津, 妙華 and 石川, 由羽 and 高田, 雅美 and 城, 和貴 and Aya, Iwata and Kazumi, Kosaka and Taeka, Awazu and Yu, Ishikawa and Masami, Takata and Kazuki, Joe}, issue = {10}, month = {Sep}, note = {本稿では,近代書籍で用いられているフォントを用いた活字を自動で生成する手法を提案する.近代デジタルライブラリーで一般公開されている近代書籍のテキスト化に使用する多フォント活字認識手法の精度向上のため,学習データを十分に増やす必要がある.しかし,近代書籍に使用されているフォントは多種多様であるため,十分な学習データを収集することは困難である.そこで本稿では,学習用の近代書籍フォントセットを自動生成する変換フィルタを,遺伝的プログラミングを用いて生成する., In this paper, we present an automatic training data generation method for automatic text extraction for “digital library from Meiji Era”. To Improve the accuracy of multi- font type recognition method that is used in the text of Early-modern Japanease printed books that are vieable at the public in digital library from meiji era Web site, it is necessary to increase the learning data suficiately. Because the font used in the books is a wide variety, it is difficult to collect enough training data. So, we generate a conversion filter that automatically generating a early-modern book font set for learning using a genetic programming and shows the effectiveness of the font set.}, title = {近代書籍用OCRのための学習用特定フォントセットの自動生成手法}, year = {2015} }