Item type |
SIG Technical Reports(1) |
公開日 |
2024-03-05 |
タイトル |
|
|
タイトル |
民俗学資料に於けるトピック間のエントロピー共起に基づく文書検索法の評価実験 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An Evaluation Experiment of Document Retrieval Methods based on Entropy Co-occurrence on Topics in Folk Cultural Materials |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SITE-E |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
神奈川大学大学院工学研究科 |
著者所属 |
|
|
|
神奈川大学工学部 |
著者所属 |
|
|
|
神奈川大学工学部 |
著者所属 |
|
|
|
神奈川大学工学部 |
著者所属(英) |
|
|
|
en |
|
|
Engineering, Graduate School of Kanagawa University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Kanagawa University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Kanagawa University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Kanagawa University |
著者名 |
小松, 純也
森住, 哲也
細野, 海人
木下, 宏揚
|
著者名(英) |
Junya, Komatsu
Tetsuya, Morizumi
Kaito, Hosono
Hirotsugu, Kinoshita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
我々の一般的な言語活動において,共通認識や暗に示されるものなどといった「語りえぬもの」が存在する.このような関係が文書の中に現れる場合の検索,つまり行間を踏まえた検索を適切に行うことはできない.本論文ではこのような言語の関係によって生じる潜在的テクストを確率変数として扱うこととした.潜在的確率変数は潜在的なテクストに対する確率的なカテゴリーであり,トピックモデルが適用される.一方,オントロジーと確率空間の間は互いに随伴関係にあると定義し,オントロジー側から確率変数を解釈する事により潜在的テクストを表現する.本論文では「民俗学資料研究支援のためのトピックモデルによる検索」において提案した確率空間側のエントロピー的共起をオントロジーとして関連付けるモデルの評価を文書間の類似度を tf-idf によって計算することによって行った. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In our general linguistic activities, there are "unspeakable things" such as common knowledge or things implied. It is not possible to perform proper retrieval when such relations appear in documents, that is, retrieval based on line spacing. In this paper, we treat the latent text generated by such language relations as a random variable. Latent random variables are probabilistic categories of latent texts, to which the topic model is applied. On the other hand, the ontology and the probability space are defined to have a corollary relationship with each other, and latent texts are expressed by interpreting the random variables from the ontology side. In this paper, we evaluate the model proposed in " Search by topic model to support research of ethnographic materials " by calculating the similarity between documents using tf-idf, which relates entropic co-occurrences in the probability space as an ontology. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12326962 |
書誌情報 |
研究報告インターネットと運用技術(IOT)
巻 2024-IOT-64,
号 70,
p. 1-8,
発行日 2024-03-05
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8787 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |