WEKO3
アイテム
SVMに基づく多フォント漢字認識手法の評価
https://ipsj.ixsq.nii.ac.jp/records/72992
https://ipsj.ixsq.nii.ac.jp/records/729928a0db71e-8e35-4700-aeca-c247d6a92f58
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2011-02-28 | |||||||
| タイトル | ||||||||
| タイトル | SVMに基づく多フォント漢字認識手法の評価 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Evaluation of the SVM based Multi-Fonts Kanji Character Recognition Method for Early-Modern Japanese Printed Books | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 奈良女子大学大学院人間文化研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良女子大学大学院人間文化研究科 | ||||||||
| 著者所属 | ||||||||
| 国立国会図書館 | ||||||||
| 著者所属 | ||||||||
| 奈良女子大学大学院人間文化研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Diet Library | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
| 著者名 |
榎本, 友理枝
高田, 雅美
木目沢, 司
城, 和貴
× 榎本, 友理枝 高田, 雅美 木目沢, 司 城, 和貴
|
|||||||
| 著者名(英) |
Yurie, Enomoto
Masami, Takata
Tsukasa, Kimesawa
Kazuki, Joe
× Yurie, Enomoto Masami, Takata Tsukasa, Kimesawa Kazuki, Joe
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 国立国会図書館では,所蔵する明治から大正期にかけての近代書籍を画像データとしてアーカイブ化し,Web 上で一般に公開している.このデジタルアーカイブをより簡便に利用できるよう,近代書籍画像の早急なテキスト化が望まれている.本稿では,SVM に基づく近代書籍に特化した多フォント漢字認識手法の有効性を実証する.出版社が異なる書籍から切り出した様々なフォントの漢字 256 種を用いて識別実験を行った結果,常に 92% 以上の識別率を得ることができた.従って,文字画像に対して PDC 特徴を抽出し,SVM で学習・識別を行うという提案手法が近代書籍で使用されている多フォント漢字認識に対して有効な手法であるといえる. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | The national diet library in Japan provides a web based digital archive for early-modern printed books by image. To make better use of the digital archive, the book images should be converted to text data. In this paper, we evaluate the SVM based multi-fonts Kanji character recognition method for early-modern Japanese printed books. Using several sets of Kanji characters clipped from different publishers' books, we obtain the recognition rate of more than 92% for 256 kinds of Kanji characters. It proves our recognition method, which uses the PDC feature of given Kanji character images for learning and recognizing with a SVM, is effective for the recognition of multi-fonts Kanji character for early-modern Japanese printed books. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10505667 | |||||||
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2011-MPS-82, 号 14, p. 1-6, 発行日 2011-02-28 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||