ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2021

図書館における機械学習技術の実践的適用について 次世代デジタルライブラリーの機能改修及び新たなデータセットの公開を中心に

https://ipsj.ixsq.nii.ac.jp/records/215772
https://ipsj.ixsq.nii.ac.jp/records/215772
ebc77114-1617-48eb-96b1-238c1d634f92
名前 / ファイル ライセンス アクション
IPSJ-CH2021011.pdf IPSJ-CH2021011.pdf (1.5 MB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2021-12-04
タイトル
タイトル 図書館における機械学習技術の実践的適用について 次世代デジタルライブラリーの機能改修及び新たなデータセットの公開を中心に
タイトル
言語 en
タイトル On the practical application of machine learning in the library Focusing on the functional modification of the next digital library and the release of new datasets
言語
言語 jpn
キーワード
主題Scheme Other
主題 データセット,機械学習,画像検索,OCR,次世代デジタルライブラリー
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
国立国会図書館
著者所属(英)
en
National Diet Library
著者名 青池, 亨

× 青池, 亨

青池, 亨

Search repository
著者名(英) Toru, Aoike

× Toru, Aoike

en Toru, Aoike

Search repository
論文抄録
内容記述タイプ Other
内容記述 国宣国会図書館のデジタル化資料について,機械学習を適用したサービス提供の改善を試みるに当たっては, 日指す機能を実現するための有効性や構築コストに考慮してデータセットの設計・整備を行うこと,また,既存の大規模データ資源や日覚ましく進展する画像認識分野の機械学習アルゴリズムを活用することの両方に目を配る必要がある.本論文では,新たに構築・公開したデータセット件(画像タグデータセットNDL-ImageLabel及びOCR1行データセットについて,その設計思想と有効性を論じ,実際の活用事例として年末にサービスの改修を予定している次世代デジタルライブラリーの技術要素や新規事業の技術検討における役割を紹介する.本論文で取り上げたデータセットや機械学習モデルについてはNDLラボのGitHub(https://github.com/ndl-lab/)から公開している.
論文抄録(英)
内容記述タイプ Other
内容記述 When attempting to improve services by applying machine learning to the digitized materials held by the National Diet Library (NDL), it is important to consider the preparation of data sets based on a design that takes into account the effectiveness and construction cost to realize aimed functions. It is also necessary to pay attention to the coordination of existing large-scale data resources and machine learning algorithms in the field of image recognition, which has made remarkable progress in recent years. In this paper, we discuss the design concept and effectiveness of two newly released datasets (image tagging dataset NDL-ImageLabel and OCR one-line dataset) and, as an actual case study, introduce how they are playing a role both in the inhouse technical renovation of the Next Digital Library, which is scheduled to be released to the public at the end of the FY2021, and in the technical investigation for new library services. The datasets and the machine learning models discussed in this paper are available on GitHub repository of NDL Labs (https://github.com/ndl-lab/).
書誌情報 じんもんこん2021論文集

巻 2021, p. 72-79, 発行日 2021-12-04
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 16:01:01.883615
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3