Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-08 |
タイトル |
|
|
タイトル |
民俗学資料研究支援のためのトピックモデルによる検索 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Search by topic model to support research of ethnographic materials |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SITEセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
神奈川大学大学院工学研究科 |
著者所属 |
|
|
|
神奈川大学工学部 |
著者所属 |
|
|
|
神奈川大学工学部 |
著者所属(英) |
|
|
|
en |
|
|
Engineering, Graduate School of Kanagawa University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Kanagawa University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Engineering, Kanagawa University |
著者名 |
小松, 純也
森住, 哲也
木下, 宏揚
|
著者名(英) |
Junya, Komatsu
Tetsuya, Morizumi
Hirotsugu, Kinoshita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
テクストを検索するシステムでは,単語自体を検索する方法,テクストの関係性を利用する検索方法,更にオントロジー関係を利用する検索方法がある.しかしいずれの方法もテクストが持つ概念的意味自体が文脈の中に現れる場合の検索,言い換えれば行間を読むという行為に類似な検索(潜在的テクスト検索と呼ぶ事にする)は不可能である. 本論文ではこの課題に対し,潜在的テクストを確率変数と見做す.潜在的確率変数は潜在的なテクストに対する確率的なカテゴリーであり,トピックモデルが適用される.一方,オントロジーと確率空間の間は互いに随伴関係にあると定義し,オントロジー側から確率変数を解釈する事により潜在的テクストを表現する.本論文では確率空間側のエントロピー的共起をオントロジーとして関連付けるモデルを提案する.更に,トピックモデルのトピック数の変動によって生じるトピック同士のエントロピーの変化を共起性と定義した場合の妥当性について示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In a text retrieval system, there are three types of retrieval methods: word retrieval, textual relationship retrieval, and ontology retrieval. However, none of these methods can search for the conceptual meaning of a text itself when it appears in the context, in other words, a search similar to the act of reading between the lines (we call this latent text search). In this paper, latent texts are considered as random variables. Latent random variables are probabilistic categories for latent texts, to which the topic model is applied. On the other hand, ontology and probability space are defined to have a corollary relationship with each other, and latent texts are represented by interpreting random variables from the ontology side. In this paper, we propose a model that relates entropic co-occurrences on the probability space side as an ontology. Furthermore, we show the validity of defining co-occurrence as the change in entropy between topics caused by changes in the number of topics in the topic model. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12326962 |
書誌情報 |
研究報告インターネットと運用技術(IOT)
巻 2023-IOT-60,
号 13,
p. 1-6,
発行日 2023-03-08
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8787 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |