WEKO3
アイテム
情報量重み付きJaccard係数の提案と評価
https://ipsj.ixsq.nii.ac.jp/records/2002868
https://ipsj.ixsq.nii.ac.jp/records/200286811bed6e4-616e-47b7-aafc-09ec2d4bb10d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2027年6月30日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, CSEC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2025-06-30 | |||||||||
タイトル | ||||||||||
言語 | ja | |||||||||
タイトル | 情報量重み付きJaccard係数の提案と評価 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Proposal and Analysis of Entropy-Weighted Jaccard Index | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | CSEC | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
立命館大学大学院情報理工学研究科 | ||||||||||
著者所属 | ||||||||||
立命館大学情報理工学部 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Graduate School of Information Science and Engineering, Ritsumeikan University | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||||
著者名 |
木村,悠生
× 木村,悠生
× 上原,哲太郎
|
|||||||||
著者名(英) |
Yuuki Kimura
× Yuuki Kimura
× Tetsutaro Uehara
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 集合間の類似度指標として,Jaccard係数が広く用いられている.Jaccard係数は単純で計算効率が高いが,要素の出現頻度や重要度を区別できないという課題がある.本研究では,要素の出現確率に基づく情報量を重みとして導入し“情報量重み付きJaccard係数”を提案する.複数のデータセットに基づく実験により,提案手法は頻度偏りの大きい集合において従来指標を上回る性能を示すことが明らかになった. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | The Jaccard Index is widely used as a measure of similarity between sets. Although the Jaccard Index is simple and computationally efficient, it has the problem of not being able to distinguish between the frequency of occurrence and importance of elements. In this study, we propose an “Entropy Weighted Jaccard Index” by introducing entropy based on the probability of occurrence of elements as weights. Experimental results on several datasets show that the proposed method outperforms conventional indices for sets with highly skewed frequency distributions. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11235941 | |||||||||
書誌情報 |
研究報告コンピュータセキュリティ(CSEC) 巻 2025-CSEC-110, 号 34, p. 1-6, 発行日 2025-06-30 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8655 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |