Item type |
SIG Technical Reports(1) |
公開日 |
2025-05-10 |
タイトル |
|
|
言語 |
ja |
|
タイトル |
歴史資料のTEIマークアップ:『延喜式』の校異注記述と固有名詞の一括処理 |
タイトル |
|
|
言語 |
en |
|
タイトル |
TEI Markup of Historical Sources: Encoding Variant Readings and Batch Processing of Proper Nouns in the Engi shiki |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
人文情報学研究所,慶應大学 |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
International Institute for Digital Humanities, Keio University |
著者名 |
渡邉,美紗子
戸村,美月
三輪,仁美
後藤,真
三上,喜孝
永崎,研宣
|
著者名(英) |
Misako Watanabe
Mizuki Tomura
Hitomi Miwa
Makoto Goto
Yoshitaka Mikami
Kiyonori Nagasaki
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿は,『延喜式』を対象としたTEIマークアップとその手法を紹介するものである.近年,国内外で古典籍のテキストデータのTEI/XML化が推進されているが,日本古代の史料のテキストデータは流通・共有が一部にとどまっている.そこで『延喜式』の国際的流通と研究での高度活用を目指し,校異注と固有名詞のTEIマークアップを試みた.校異注をTEI/XMLで記述すると,文字の異同の情報は写本単位で取り出しやすくなり,視認性が向上する一方,内容が多岐にわたるため画一的なマークアップは困難である.そのため,どのような意図で校訂したか,『延喜式』をどのように解釈したかなどの詳細情報は,校訂者による記録を再現できるよう記述方法を検討した.また固有名詞は,対象テキストが固定される点を活かしたPythonによる一括マークアップが効率およびコストの面で有用であった.さらにマークアップ情報をrelationタグにまとめることで,データの汎用性を高める一助とした.その結果,テキストデータに史料が有する特性を反映しつつ,研究に必要十分な情報を書き込むことが可能となった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This report presents a TEI-based markup of the Engi shiki and the methodology behind it. In recent years, the TEI/XML encoding of classical texts has been actively promoted both in Japan and abroad. However, the textual data of early Japanese historical sources is still limited in terms of its distribution and accessibility. In light of this, we undertook the TEI markup of variant readings and proper nouns in the Engi shiki, aiming to facilitate both international dissemination and advanced scholarly use. Encoding variant readings in TEI/XML improves readability and enables efficient extraction of character-level differences. At the same time, due to the wide range of content and variation in editorial approaches, a uniform markup strategy proves difficult. For this reason, we explored markup methods that allow the representation of editorial intentions and interpretations of the Eng shiki, aiming to reproduce the detailed notes recorded by individual editors. As for proper nouns, we employed batch markup using Python, taking advantage of the fixed nature of the target text. This approach proved effective in improving efficiency and reducing labor costs. Furthermore, by organizing the markup information using <relation> tags, we enhanced the reusability and interoperability of the data. As a result, the markup not only reflects the specific characteristics of the historical source but also enables the encoding of sufficient information for scholarly research. |
|
言語 |
en |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN1010060X |
書誌情報 |
研究報告人文科学とコンピュータ(CH)
巻 2025-CH-138,
号 6,
p. 1-8,
発行日 2025-05-10
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8957 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |