Item type |
Symposium(1) |
公開日 |
2024-11-30 |
タイトル |
|
|
タイトル |
くずし字AI-OCRによる「細川家文書」の翻刻と全文検索システムの構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Transcribing “Hosokawa Family Documents” by Kuzushiji AI-OCR and Construction of Full-text Search System |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
AI-OCR,古文書,くずし字,全文検索 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
TOPPAN株式会社 |
著者所属 |
|
|
|
TOPPAN株式会社 |
著者所属 |
|
|
|
熊本大学 永青文庫研究センター |
著者所属 |
|
|
|
TOPPANエッジ株式会社 |
著者所属 |
|
|
|
TOPPANデジタル株式会社 |
著者所属 |
|
|
|
TOPPANデジタル株式会社 |
著者所属(英) |
|
|
|
en |
|
|
TOPPAN Inc. |
著者所属(英) |
|
|
|
en |
|
|
TOPPAN Inc. |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University Eisei Bunko Research Center |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University Eisei Bunko Research Center |
著者所属(英) |
|
|
|
en |
|
|
TOPPAN Edge Inc. |
著者所属(英) |
|
|
|
en |
|
|
TOPPAN Digital Inc. |
著者所属(英) |
|
|
|
en |
|
|
TOPPAN Digital Inc. |
著者名 |
大澤, 留次郎
福井, 尚子
稲葉, 継陽
後藤, 典子
國島, 圭
河津, 光晟
岡田, 崇
|
著者名(英) |
OSAWA, Tomejiro
FUKUI, Naoko
INABA, Tsuguharu
GOTO, Noriko
KUNISHIMA, Kei
KAWAZU, Kosei
OKADA, Takashi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
当グループは永青文庫所蔵の『細川家文書』のうち『奉行所日帳』をはじめとする約5万枚の古文書をくずし字AI-OCRを用いて翻刻し全文検索可能な状態にした.本稿ではAI-OCRによるテキストデータ化処理の概要および歴史学研究の新たな手法の可能性について述べる. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Our group has transcribed approximately 50,000 ancient documents of Hosokawa Family in the Eisei Bunko collection, using Kuzushiji AI-OCR. We have also constructed a full-text search system for these texts. This paper outlines the text data processing by AI-OCR and presents a new method for historical research. |
書誌情報 |
じんもんこん2024論文集
巻 2024,
p. 99-104,
発行日 2024-11-30
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |