Item type |
Symposium(1) |
公開日 |
2019-01-11 |
タイトル |
|
|
タイトル |
本の厚みによる歪みを考慮した光学文字認識 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Optical character recognition considering distortion due to book thickness |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
光学文字認識,畳み込みニューラルネットワーク,生成型学習法 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
明星大学情報学部情報学科 |
著者所属 |
|
|
|
明星大学情報学部情報学科 |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science, School of Information Science, Meisei University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science, School of Information Science, Meisei University |
著者名 |
比留川, 翔哉
丸山, 一貴
|
著者名(英) |
Shoya, Hirukawa
Kazutaka, Maruyama
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年, 様々な光学文字認識サービスが利用できるが, 歪み補正や, 平滑化などの適切な補正が行われず精度低下の原因になる. 本研究は, 本の厚みによる歪みに近似した画像を生成し, 畳み込みニューラルネットワークを用いて文字認識を行う. 本研究では, 厚みのある本を見開きにした場合に左右に湾曲する歪みを前提とする. そのため, フォントデータから生成した文字画像をOpenCVのremapメソッドを用いて歪ませることで, 学習データを生成した. 提案手法の精度は, 生成した画像のホールドアウト検証では99.97%となったものの, 撮影した書籍の文字画像では既存手法より劣る結果となった. この結果は, 文字色や背景色などの学習画像を生成する要件と層の最適化が不十分なためだと考えられる. 今後の課題として, 精度の向上を目指していきたい. |
書誌情報 |
第60回プログラミング・シンポジウム予稿集
巻 2019,
p. 81-86,
発行日 2019-01-11
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |