ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2014

活字資料のコーパス化における外字チェックと処理

https://ipsj.ixsq.nii.ac.jp/records/107388
https://ipsj.ixsq.nii.ac.jp/records/107388
7bc373f4-548c-4d2f-9825-3be46e94badd
名前 / ファイル ライセンス アクション
IPSJ-S-CH2014011.pdf IPSJ-S-CH2014011.pdf (502.0 kB)
Copyright (c) 2014 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2014-12-06
タイトル
タイトル 活字資料のコーパス化における外字チェックと処理
タイトル
言語 en
タイトル Extracting and processing external characters upon constructing corpora of printed documents
言語
言語 jpn
キーワード
主題Scheme Other
主題 文字情報;;コーパス
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
昭和女子大学
著者所属
東京農工大学
著者所属(英)
en
Showa Wemen's University
著者所属(英)
en
Tokyo University of Agriculture and Technology
著者名 須永, 哲矢

× 須永, 哲矢

須永, 哲矢

Search repository
堤, 智昭

× 堤, 智昭

堤, 智昭

Search repository
著者名(英) Tetsuya, Sunaga

× Tetsuya, Sunaga

en Tetsuya, Sunaga

Search repository
Tomoaki, Tsutsumi

× Tomoaki, Tsutsumi

en Tomoaki, Tsutsumi

Search repository
論文抄録
内容記述タイプ Other
内容記述 歴史的作品の活字資料からコーパスを作るときの文字処理の方法を定めた.活字資料の電子化にあたっては,外字処理・字体包摂の2つが中心課題となるが,両者をまとめて処理できるツールを利用し,作業方式を確立することにより,もとになるテキストの特性によらず,統一的な処理を可能にした.本作業のために開発したツールと本稿で提案した一連の作業手順は,コーパス構築という作業のみならず,活字研究にも適用可能である.研究利用の例として,小学館新編日本古典文学全集 『日本霊異記』等の漢字活字を調査し,JIS X0213 や UniCode でどの程度再現できるかを明らかにした.
論文抄録(英)
内容記述タイプ Other
内容記述 The paper proposes a new processing procedure of external characters included in printed historical texts, which is essential to constructing an electronic corpus of historical documents. Digitization of printed historical documents so far has two major problems to be dealt with: representation of external characters and establishment of unification standard. We present a solution to the problems, introducing a new software tool which handles the two problems altogether. By applying the tool, the characters can be processed uniformly, regardless of the document variation. Furthermore, the processing tool and a series of procedures or our proposal can also be applied to character research. In the paper, we present a small sample investigation on the external characters of SNKBZ, Shogakukan, revealing what percentage of the total printing types JIS X0213 and Unicode respectively can represent.
書誌情報 じんもんこん2014論文集

巻 2014, 号 3, p. 69-74, 発行日 2014-12-06
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 09:02:17.237703
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3