| Item type |
Symposium(1) |
| 公開日 |
2022-12-09 |
| タイトル |
|
|
タイトル |
構造化テキストデータの活用における現状と課題 ―TEIに準拠した『浄土真宗聖典全書』全文検索システムの開発を通じて― |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Current Status and Issues in Utilization of Structured Text Data: Development of a Full-Text Search System for TEI-Compliant Buddhist Scriptures |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
仏教学,TEI ガイドライン,テキスト構造化,全文検索,Buddhist studies,TEI Guidelines,Text encoding,Full-text search |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
人文情報学研究所 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属 |
|
|
|
浄土真宗本願寺派総合研究所 |
| 著者所属 |
|
|
|
浄土真宗本願寺派総合研究所 |
| 著者所属 |
|
|
|
浄土真宗本願寺派総合研究所 |
| 著者所属 |
|
|
|
浄土真宗本願寺派総合研究所 |
| 著者所属 |
|
|
|
東京大学 |
| 著者所属(英) |
|
|
|
en |
|
|
International Institute for Digital Humanities,The University of Tokyo,Jodo Shinshu Honganji-ha Research Institute,Jodo Shinshu Honganji-ha Research Institute,Jodo Shinshu Honganji-ha Research Institute,Jodo Shinshu Honganji-ha Research Institute,The University of Tokyo |
| 著者名 |
永崎, 研宣
中村, 覚
田中, 真
西河, 雅人
林, 龍樹
井上, 慶淳
下田, 正弘
|
| 著者名(英) |
Kiyonori, Nagasaki Satoru Nakamura Makoto Tanaka Masato Nishikawa Ryuju Hayashi Keijun Inoue Masahiro Shimoda
| en |
Kiyonori, Nagasaki Satoru Nakamura Makoto Tanaka Masato Nishikawa Ryuju Hayashi Keijun Inoue Masahiro Shimoda
|
Search repository
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
『浄土真宗聖典全書』は、Procedural markup を志向した独自タグセットによる構造化テキストデータとして紙媒体で印刷・刊行された。本稿は、そこで用いられたデータを国際標準であるTEI ガイドラインに準拠したDescriptive markup へと変換して利便性の高い全文検索システムを開発した際の、テキストデータ変換における現状と課題について議論する。変換はPython を用いたプログラムを開発することで機械的に行われたが、この種の変換ではある程度までは機械処理での変換が可能であるものの、それを踏まえた上で、記述の対象となる構造の選択はあくまでもシステムを作成する人や組織の側に委ねられていることを確認した。 |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Jodo Shinshu Seiten Zensho (A Collection of Jodo Shinshu Writings)has been printed and published in paper form as structured text data with an original tag set oriented toward Procedural markup. This paper discusses the current status and issues in converting text data used in the books to descriptive markup that conforms to the TEI guidelines, an international standard, to develop a highly convenient full-text search system. The conversion was done mechanically by developing a program using Python. Although this type of conversion can be done by machine processing to some extent, it was confirmed that, based on this, the choice of the target structure of the description is solely left to the person or organization creating the system. |
| 書誌情報 |
じんもんこん2022論文集
巻 2022,
p. 73-78,
発行日 2022-12-02
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |