| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-12-14 |
| タイトル |
|
|
タイトル |
クラスタリングと近傍探索を用いた知識グラフ埋め込みモデルにおけるネガティブサンプリング手法の検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Proposal of Negative Sampling Methods in Knowledge Graph Embedding Using Clustering and Neighborhood Search |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
インターフェース/計画・推定 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
慶應義塾大学院理工学研究科 |
| 著者所属 |
|
|
|
慶應義塾大学院理工学研究科 |
| 著者所属 |
|
|
|
慶應義塾大学院理工学研究科 |
| 著者所属 |
|
|
|
慶應義塾大学院理工学研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Keio University |
| 著者所属(英) |
|
|
|
en |
|
|
Keio University |
| 著者所属(英) |
|
|
|
en |
|
|
Keio University |
| 著者所属(英) |
|
|
|
en |
|
|
Keio University |
| 著者名 |
北川, 栞
田中, 颯
柳沼, 優太
重野, 寛
|
| 著者名(英) |
Shiori, Kitagawa
Hayate, Tanaka
Yuta, Yaginuma
Hiroshi, Shigeno
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
主にリコメンド分野などにおいて知識グラフの活用が注目されている.知識グラフをベクトル空間にマッピングする知識グラフ埋め込みモデル (KGE) モデルは,その性能を向上させるために様々な評価関数が考案される一方で,学習に必要なネガティブサンプルの作成手法についての検討はあまりなされていない.本稿では,より学習に効果的なネガティブサンプルを効率よく作成することを目的に,クラスタリングと近傍探索を用いたネガティブサンプリング手法を提案する.クラスタリングを用いて,1 つのクラスタに 350 程度のエンティティが含まれるようにグラフ内のエンティティを分割して計算することが最も効率的に計算できることを確認した.また icews14 を入力とした埋め込みモデルにおいて従来の手法と比較して,Hit@10 を TransE では 2.35%,TeRo では 1.61% 向上できることが示された. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The utilization of knowledge graphs, particularly in the recommendation field, has garnered attention. Knowledge Graph Embedding (KGE) models, which map knowledge graphs into vector spaces, have seen various evaluation functions devised to enhance their performance. However, there has been limited exploration of methods for creating negative samples essential for learning. In this paper, aiming to efficiently generate more effective negative samples for learning, we propose a negative sampling method using clustering and nearest neighbor search.We confirmed that utilizing clustering to calculate efficiently by dividing into clusters with approximately 350 entities each is the most effective approach. Additionally, when comparing with conventional methods in embedding models using icews14 as input, it was demonstrated that the proposed method can improve Hit@10 by 2.35% in TransE and 1.61% in TeRo. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10116224 |
| 書誌情報 |
研究報告マルチメディア通信と分散処理(DPS)
巻 2023-DPS-197,
号 20,
p. 1-6,
発行日 2023-12-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8906 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |