WEKO3
アイテム
複数フォント3000カテゴリを対象とした回転文字認識
https://ipsj.ixsq.nii.ac.jp/records/113685
https://ipsj.ixsq.nii.ac.jp/records/1136850313ac9e-8dce-4033-a56e-3630c3209f0a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2015 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2015-02-27 | |||||||||||
タイトル | ||||||||||||
タイトル | 複数フォント3000カテゴリを対象とした回転文字認識 | |||||||||||
タイトル | ||||||||||||
言語 | en | |||||||||||
タイトル | Rotated Character Recognition over 3,000 Categories with A Few Popular Fonts | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
福井大学 | ||||||||||||
著者所属 | ||||||||||||
福井大学 | ||||||||||||
著者所属 | ||||||||||||
福井大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
University of Fukui | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
University of Fukui | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
University of Fukui | ||||||||||||
著者名 |
馬場, 悠太
× 馬場, 悠太
× 長谷, 博行
× 東海, 彰吾
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 筆者らはこれまでパラメトリック固有空間法を用いた回転文字認識の研究を行ってきた.入力画像は固有部分空間に写像されるが,その際入力画像を一定角回転し複数の画像を生成してそれらを固有部分空間に投影することにより,単純に投影するよりも偶発的な誤分類を避けることができる.その結果,単一フォントの漢字を対象とした場合では 10 次元程度で 99% 以上の正読率が得られ,角度推定も高い精度であった.本報告ではこの方法を JIS 第一水準漢字,ひらがな,カタカナ全 3,133 カテゴリに適用し,認識実験を行った.学習文字は 10 度ごとに回転した 36 個のデータを用いて固有部分空間を生成し,テストデータは 7 度ごとに回転した総数 319,566 データで実験を行った.次に実際にカメラで撮影された文字画像には二次元的な回転だけでなく三次元的な回転が含まれていると考えられるため,三次元的に変形した文字画像についても同じ辞書構成でどの程度対応可能なのか実験を行った.さらに認識結果として回転角度を得ることができるのを利用して文書画像の回転角度推定を行った.最後に,現在のままでは 1 文字の認識を行うために 0.6[秒] 程度かかってしまっているため,認識に要する時間を短縮するために正しく認識される際の距離のデータを閾値に利用して計算時間を短縮した. | |||||||||||
論文抄録(英) | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | We proposed a rotated character recognition method using eigen-subspace characterized multiple projection and simple projection so far. In our previous work, a high recognition accuracy over 99.8% was achieved especially by multiple projections of the input rotated images. In this paper, a challenge of rotated character recognition for ideal character images of Japanese Kanji, Hiragana and Katakana with two popular fonts of Mincho and Gothic is presented. First, we obtained very high accuracy and high angle precision for 3,133 Japanese categories of two fonts. Second, this method were tested for not only 2D rotation but also 3D rotation of a character image. As the result, when the angles of X and Y axes were within 6 degrees, we found out that we can get more than 90% of recognition rate. Next, we experimented for camera images, then when the character size is over 45×45 pixels, it is found that we can get a high accuracy like the ideal character image. Next, we applied this method to a rotated document image with a complicated layout. As the result, we obtained a good estimation statistically by voting the recognized angle of a connected component. At last, although the computation time using all dimensions per a character was 0.6[s], the computation time was reduced by decreasing the number of categories using a distance threshold. An advantage of this method is to be obtained the category, the font and the angle at the same time. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AA11131797 | |||||||||||
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2015-CVIM-196, 号 14, p. 1-8, 発行日 2015-02-27 |
|||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |