@techreport{oai:ipsj.ixsq.nii.ac.jp:00241495, author = {畔柳, 愛子 and 松田, 悠 and 松本, 尚 and Aiko, Kuroyanagi and Haruka, Matsuda and Takashi, Matsumoto}, issue = {15}, month = {Dec}, note = {広く活用されている文字認識 (OCR) 技術は,文字領域の検出工程と文字の認識工程に分けて行っているため,前処理など多くの工程と文字単位や行単位の文字認識作業の繰り返しが必要となる.一方,深層学習による物体検出器を文字認識に流用することにより,前処理無しで複数の文字検出(物体検出と認識)を同時に行うことができる.松本研究室では,物体検出器のYOLO (You Only Look Once)v3 を利用した日本語文字認識が,学習方法や文字判定方法に工夫を施すことにより,実用レベルで実現可能なことを示した.YOLO には後継のバージョンが複数存在しているが,どのバージョンが文字認識に適しているかまでは精査されていない.本研究では,YOLOv6 に焦点を当てて,文字認識器としての適性を調べる.YOLOv6 は,畳込み層を含む基本構造に EfficientRep を採用し,推論の高速性,アンカーフリー方式,用途に合わせたモデル選択可能を特徴とする物体検出器である.YOLOv6 と YOLOv3 に関して,文字認識の推論および学習の性能を比較して,どちらがより日本語文字認識用の物体検出モデルとして優れているかを明らかにする., While widely used Optical Character Recognition (OCR) technology divides the process into character region detection and character recognition, requiring many pre-processing steps and repeated character-by-character or line-by-line recognition tasks, deep learning-based object detectors can be applied to character recognition, enabling simultaneous detection and recognition of multiple characters without pre-processing. The Matsumoto Laboratory has demonstrated the feasibility of Japanese character recognition using the object detector YOLO (You Only Look Once) v3 with modifications to the learning method and character judgment method. Although there are multiple successor versions of YOLO, which version is most suitable for character recognition has not been thoroughly investigated. This study focuses on YOLOv6 to investigate its suitability as a character recognizer. YOLOv6 is an object detector featuring EfficientRep for the basic structure including convolutional layers, high inference speed, an anchor-free method, and the ability to select models for specific applications. We compare the inference and learning performance of YOLOv6 and YOLOv3 for character recognition to determine which is more suitable as an object detection model for Japanese character recognition.}, title = {深層学習による物体検出モデルの文字認識器としての適性について---YOLOv6の日本語文字認識器としての適性--}, year = {2024} }