@techreport{oai:ipsj.ixsq.nii.ac.jp:00233090, author = {小松, 純也 and 森住, 哲也 and 細野, 海人 and 木下, 宏揚 and Junya, Komatsu and Tetsuya, Morizumi and Kaito, Hosono and Hirotsugu, Kinoshita}, issue = {70}, month = {Mar}, note = {我々の一般的な言語活動において,共通認識や暗に示されるものなどといった「語りえぬもの」が存在する.このような関係が文書の中に現れる場合の検索,つまり行間を踏まえた検索を適切に行うことはできない.本論文ではこのような言語の関係によって生じる潜在的テクストを確率変数として扱うこととした.潜在的確率変数は潜在的なテクストに対する確率的なカテゴリーであり,トピックモデルが適用される.一方,オントロジーと確率空間の間は互いに随伴関係にあると定義し,オントロジー側から確率変数を解釈する事により潜在的テクストを表現する.本論文では「民俗学資料研究支援のためのトピックモデルによる検索」において提案した確率空間側のエントロピー的共起をオントロジーとして関連付けるモデルの評価を文書間の類似度を tf-idf によって計算することによって行った., In our general linguistic activities, there are "unspeakable things" such as common knowledge or things implied. It is not possible to perform proper retrieval when such relations appear in documents, that is, retrieval based on line spacing. In this paper, we treat the latent text generated by such language relations as a random variable. Latent random variables are probabilistic categories of latent texts, to which the topic model is applied. On the other hand, the ontology and the probability space are defined to have a corollary relationship with each other, and latent texts are expressed by interpreting the random variables from the ontology side. In this paper, we evaluate the model proposed in " Search by topic model to support research of ethnographic materials " by calculating the similarity between documents using tf-idf, which relates entropic co-occurrences in the probability space as an ontology.}, title = {民俗学資料に於けるトピック間のエントロピー共起に基づく文書検索法の評価実験}, year = {2024} }