@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00222560, author = {比留川, 翔哉 and 丸山, 一貴 and Shoya, Hirukawa and Kazutaka, Maruyama}, book = {第60回プログラミング・シンポジウム予稿集}, month = {Jan}, note = {近年, 様々な光学文字認識サービスが利用できるが, 歪み補正や, 平滑化などの適切な補正が行われず精度低下の原因になる. 本研究は, 本の厚みによる歪みに近似した画像を生成し, 畳み込みニューラルネットワークを用いて文字認識を行う. 本研究では, 厚みのある本を見開きにした場合に左右に湾曲する歪みを前提とする. そのため, フォントデータから生成した文字画像をOpenCVのremapメソッドを用いて歪ませることで, 学習データを生成した. 提案手法の精度は, 生成した画像のホールドアウト検証では99.97%となったものの, 撮影した書籍の文字画像では既存手法より劣る結果となった. この結果は, 文字色や背景色などの学習画像を生成する要件と層の最適化が不十分なためだと考えられる. 今後の課題として, 精度の向上を目指していきたい.}, pages = {81--86}, publisher = {情報処理学会}, title = {本の厚みによる歪みを考慮した光学文字認識}, volume = {2019}, year = {2019} }