Item type |
SIG Technical Reports(1) |
公開日 |
2022-02-12 |
タイトル |
|
|
タイトル |
日本中世古記録を対象としたトピック抽出自動化システムの構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Development of an Automated Topic Extraction System for Ancient Japanese Medieval Records |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院新領域創成科学研究科 |
著者所属 |
|
|
|
東京大学史料編纂所 |
著者所属 |
|
|
|
東京大学史料編纂所 |
著者所属 |
|
|
|
東京大学大学院新領域創成科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Frontier Sciences, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Historiographical Institute, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Historiographical Institute, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Frontier Sciences, The University of Tokyo |
著者名 |
鳥居, 克哉
中村, 覚
山田, 太造
稗方, 和夫
|
著者名(英) |
Katsuya, Torii
Satoru, Nakamura
Taizo, Yamada
Kazuo, Hiekata
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,日本史学者の史料研究支援のために,史料群に対する可用性と有用性を高めるトピック抽出を自動で行うシステムの開発を行った.ルールベースにより抽出した人名及び N-gram や Sentencepiece によって分割した用語から Bag-of-Word を生成し,LDA (Latent Dirichlet Allocation) を適用することでトピック分析を行った.さらに,史料と人物索引表を入力としてこの一連の分析を行う Web システムをクラウド上に構築した.また,鎌倉時代の公卿である藤原(勘解由小路)経光が記した『民経記』を対象にこのシステムを利用し,トピック分析の結果が史実に整合していることが確認でき,有効性が示された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this study, we developed a system that automatically extracts topics to increase the availability and usefulness of historical documents to support Japanese historians in their research on historical documents. We generated a Bag-of-Words from the names of people extracted by the rule base and the terms divided by N-gram and Sentencepiece., and applied LDA (Latent Dirichlet Allocation) to analyze the topics. In addition, we constructed a web system on the cloud to perform this series of analysis using historical documents and a person index table as input. In addition, we used this system to analyze the "Minkeiki" written by Fujiwara (Kadenokoji) Tsunemitsu, a kuge of the Kamakura period, and confirmed that the results of the topic analysis were consistent with the historical facts, demonstrating its effectiveness. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN1010060X |
書誌情報 |
研究報告人文科学とコンピュータ(CH)
巻 2022-CH-128,
号 8,
p. 1-6,
発行日 2022-02-12
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8957 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |