ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. 数理モデル化と応用(TOM)
  3. Vol.8
  4. No.1

活字データの分類を用いた進化計算による近代書籍からのルビ除去

https://ipsj.ixsq.nii.ac.jp/records/141582
https://ipsj.ixsq.nii.ac.jp/records/141582
72502614-7ad9-4bf9-8db0-b08485d12887
名前 / ファイル ライセンス アクション
IPSJ-TOM0801009.pdf IPSJ-TOM0801009.pdf (733.0 kB)
Copyright (c) 2015 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2015-03-30
タイトル
タイトル 活字データの分類を用いた進化計算による近代書籍からのルビ除去
タイトル
言語 en
タイトル Ruby Removal Filters by Genetic Programming Using the Classification of Printing Type Data for Early-modern Japanese Printed Books
言語
言語 jpn
キーワード
主題Scheme Other
主題 [事例紹介論文] 近代書籍,自動テキスト化,ルビ除去,遺伝的プログラミング,クラスタリング
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
奈良女子大学
著者所属
奈良女子大学
著者所属
奈良女子大学
著者所属(英)
en
Nara Women's University
著者所属(英)
en
Nara Women's University
著者所属(英)
en
Nara Women's University
著者名 粟津, 妙華

× 粟津, 妙華

粟津, 妙華

Search repository
高田, 雅美

× 高田, 雅美

高田, 雅美

Search repository
城, 和貴

× 城, 和貴

城, 和貴

Search repository
著者名(英) Taeka, Awazu

× Taeka, Awazu

en Taeka, Awazu

Search repository
Masami, Takata

× Masami, Takata

en Masami, Takata

Search repository
Kazuki, Joe

× Kazuki, Joe

en Kazuki, Joe

Search repository
論文抄録
内容記述タイプ Other
内容記述 国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとしてWeb上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキスト化が望まれている.その際,問題となっているのがヒストグラム法では除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,その提案した手法は書籍に付加された版者や時代などの外部情報を利用しなければならず,近代デジタルライブラリのすべての外部情報を利用することはきわめて困難である.そこで本論文では,対象とする書籍画像から直接得られるデータをもとに,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する.
論文抄録(英)
内容記述タイプ Other
内容記述 In the web site of National Diet Library, the digital library from the Meiji era is open to the public. Since the early-modern Japanese printed books are given as image data, namely, full-text search is not available, automatic conversion to the text is needed. There is a major obstacle to the text conversion because of ruby, which is found in early-modern printed books. Ruby cannot be removed by the existing and traditional histogram method. Therefore, we have proposed a ruby removal method for early-modern printed books. Since the proposed method is based on the external information added to the books, the feasibility is very low. In this paper, we propose a new method to remove the ruby automatically from early-modern Japanese printed books by generating ruby removal formula by Genetic Programming using the training data based on the book images.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11464803
書誌情報 情報処理学会論文誌数理モデル化と応用(TOM)

巻 8, 号 1, p. 72-79, 発行日 2015-03-30
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7780
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 19:19:53.205837
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3