ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2024

CPU環境で高速に動作する軽量OCR「NDL古典籍OCR-Lite」の開発

https://ipsj.ixsq.nii.ac.jp/records/241527
https://ipsj.ixsq.nii.ac.jp/records/241527
6c72aaea-cb3c-483d-9df3-77803b1ba0fc
名前 / ファイル ライセンス アクション
IPSJ-CH2024026.pdf IPSJ-CH2024026.pdf (1.5 MB)
 2025年12月7日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, CH:会員:¥0, DLIB:会員:¥0
Item type Symposium(1)
公開日 2024-11-30
タイトル
タイトル CPU環境で高速に動作する軽量OCR「NDL古典籍OCR-Lite」の開発
タイトル
言語 en
タイトル Development of NDLkotenOCR-Lite, a lightweight OCR that runs at high speed in a CPU environment
言語
言語 jpn
キーワード
主題Scheme Other
主題 機械学習,OCR,古典籍,翻刻データ
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
国立国会図書館
著者所属(英)
en
National Diet Library
著者名 青池, 亨

× 青池, 亨

青池, 亨

Search repository
著者名(英) Toru, Aoike

× Toru, Aoike

en Toru, Aoike

Search repository
論文抄録
内容記述タイプ Other
内容記述 国立国会図書館(NDL)では,OCR処理プログラムとして明治期以降の活字の図書・雑誌資料を対象としたNDLOCRや古典籍資料を対象としたNDL古典籍OCRを開発し、オープンソースで公開してきた.しかし,これらのOCRは,動作環境にGPUを必須とすることから,必要な機材や技術知識の敷居が高く,事実上利用者層を狭めていた点が課題であった.近年,動画等をリアルタイムで処理するための技術として,計算負荷を大幅に抑えてGPUのない環境でも高速かつ高精度に動作する機械学習モデルの研究が顕著に進んでいる.こうした研究の知見を取り入れてこれらのOCR処理プログラムを改良し,CPU環境で高速に動作するOCRの開発をすることとした.その第一歩として「NDL古典籍OCR-Lite」の開発を行ったので報告する.あわせて,本研究の知見を活かした今後の見通しについても紹介する.なお、本研究の成果はオープンソースとして公開を予定している.
論文抄録(英)
内容記述タイプ Other
内容記述 The National Diet Library (NDL) has developed and released OCRs as open source: NDLOCR for books and periodicals in print from the Meiji period onward, and NDLkotenOCR for classical materials. However, these OCRs, which require a GPU as their operating environment, have a high barrier in terms of the necessary equipment and technical knowledge, despite their “anyone can use them freely” philosophy, and have effectively narrowed the user base. In recent years, there has been remarkable progress in research on machine learning models for real-time processing of video and other data, which can operate at high speed and with high accuracy even in environments without a GPU, greatly reducing the computational load. By reworking the OCR processing program to incorporate knowledge from these fields, the development of an OCR that runs at high speed in a CPU environment was considered. As a first step, we have developed NDLkotenOCR-Lite. The results of this study are scheduled to be released as open source at the end of November 2024. Future prospects for utilizing the findings of this research are also described.
書誌情報 じんもんこん2024論文集

巻 2024, p. 181-186, 発行日 2024-11-30
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 07:38:01.496222
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3