ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 数理モデル化と問題解決(MPS)
  3. 2023
  4. 2023-MPS-146

イラストや図を含む一般文書からのYOLOを用いた文字認識

https://ipsj.ixsq.nii.ac.jp/records/231459
https://ipsj.ixsq.nii.ac.jp/records/231459
dcb107db-bf47-4b7a-90d3-27e5dc471b2d
名前 / ファイル ライセンス アクション
IPSJ-MPS23146005.pdf IPSJ-MPS23146005.pdf (1.0 MB)
 2025年12月4日からダウンロード可能です。
Copyright (c) 2023 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, MPS:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-12-04
タイトル
タイトル イラストや図を含む一般文書からのYOLOを用いた文字認識
タイトル
言語 en
タイトル Character Recognition using YOLO From General Documents containing Illustrations and Diagrams
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
奈良女子大学
著者所属
奈良女子大学
著者所属
奈良女子大学
著者所属(英)
en
Nara Women's University
著者所属(英)
en
Nara Women's University
著者所属(英)
en
Nara Women's University
著者名 粟野, 愛未

× 粟野, 愛未

粟野, 愛未

Search repository
吉田, 有里

× 吉田, 有里

吉田, 有里

Search repository
松本, 尚

× 松本, 尚

松本, 尚

Search repository
著者名(英) Manami, Awano

× Manami, Awano

en Manami, Awano

Search repository
Yuri, Yoshida

× Yuri, Yoshida

en Yuri, Yoshida

Search repository
Takashi, Matsumoto

× Takashi, Matsumoto

en Takashi, Matsumoto

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,様々な手法の文字認識が普及しているが,その多くは文字領域の切り出しと個別文字の認識を分けて行うため,前処理等の多くの工程と認識作業の繰り返しを必要とする.我々は,これらの処理は深層学習による物体検出器を使用すれば不要であり,特にレイアウト解析のような背景から文章領域を切り出す処理が省略できると考えた.本論文では,YOLO(You Only Look Once)という物体検出器を使って文字検出と文字認識を一斉に行うことにより,文章領域を特定する前処理を用いずとも高い精度かつ一括で文字を認識できることを実証する.カラー背景・カラー文字の画像やイラストと文字が混在する画像を用いて YOLOv3 で学習した結果,画像内の文字の内正しく認識できた文字の割合はおよそ 99.40% となった.
論文抄録(英)
内容記述タイプ Other
内容記述 In recent years, various methods for character recognition have become popular, but most of them require a lot of preprocessing and repetition of recognition tasks because they separate the character region segmentation and the recognition of individual characters. We believe that these processes are unnecessary when an object detector based on deep learning is used, and in particular, the process of extracting the text area from the background, such as layout analysis, can be omitted. In this paper, we demonstrate that character detection and recognition can be performed simultaneously using an object detector called YOLO (You Only Look Once), and that characters can be recognized in a batch with high accuracy without using preprocessing to identify text regions. The results of training with YOLOv3 on images with colored backgrounds and colored text, and on images with a mixture of illustrations and text, showed that the percentage of correctly recognized characters in the images was approximately 99.40%.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10505667
書誌情報 研究報告数理モデル化と問題解決(MPS)

巻 2023-MPS-146, 号 5, p. 1-7, 発行日 2023-12-04
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8833
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 10:45:20.171232
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3