WEKO3
アイテム
意味付き文字画像を用いた文献の電子化
https://ipsj.ixsq.nii.ac.jp/records/40445
https://ipsj.ixsq.nii.ac.jp/records/40445d6c432ed-ac47-4bae-8b52-c4e7399c6458
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-05-21 | |||||||
タイトル | ||||||||
タイトル | 意味付き文字画像を用いた文献の電子化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Digitizing Documents Using Imaged Characters with Semantical Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
島根県立大学総合政策学部 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
島根県立大学総合政策学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Policy Studies, The University of Shimane | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Policy Studies, The University of Shimane | ||||||||
著者名 |
石川, 正敏
× 石川, 正敏
|
|||||||
著者名(英) |
Masatoshi, Ishikawa
× Masatoshi, Ishikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Unicodeなどの既存の符号化文字集合は,文書の記述に必要な文字種の不足があるため文献の記述を正確に表現できないことがある.そこで本研究では,符号化文字集合の代わりに文字を表現する画像で文献を電子化する.しかし文字の表現に画像を用いた場合,計算機による文字の識別が困難になるため,本稿では画像に文字に関する情報を付加する.本稿では,このような画像を意味付き文字画像と呼ぶ.意味付き文字画像を用いた文書の記述には,文書の論理構造の記述に適したXMLを利用する.さらに本稿では,提案形式に従った文書に変換するシステムを試作し提案形式の改良点などについて考察する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Coded Character sets, such as Unicode and so on, have a problem of a lack of character types for digitizing documents. We propose a method to use imaged characters for digitizing documents, instead of coded character sets. Imaged characters having their semantical information themselves are a useful tool, because they are recognizable by a computer. Weuse XML for describing electronic documents using imaged characters, because XML is suitable for describing a logical structure of a document. We tested a prototype system of converting plain texts into imaged characters,and discussed problems of the prototype for the future improvement. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2001, 号 44(2001-FI-062), p. 113-120, 発行日 2001-05-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |