| Item type |
Journal(1) |
| 公開日 |
2021-03-15 |
| タイトル |
|
|
タイトル |
多観点類似度を用いた凝集型階層クラスタリング |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Application of MultiViewpoint-based Similarity to Hierarchical Clustering |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 階層クラスタリング,多観点,類似度,時間計算量,群平均法 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| ID登録 |
|
|
ID登録 |
10.20729/00210263 |
|
ID登録タイプ |
JaLC |
| 著者所属 |
|
|
|
電気通信大学 |
| 著者所属 |
|
|
|
電気通信大学 |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Electro-Communications |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Electro-Communications |
| 著者名 |
藤原, 勇二
古賀, 久志
|
| 著者名(英) |
Yuji, Fujiwara
Hisashi, Koga
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
cosine類似度は文書クラスタリングで頻繁に使われる代表的な類似度であり,2点間の類似度を原点を基準点(始点)とする2ベクトルのなす角度から決定する.近年,ベクトルの基準点を原点ではなくデータセット内の様々な点に移動して類似度を計算する多観点類似度MVS(MultiViewpoint-based Similarity)が提案され,非階層クラスタリングにおいてcosine類似度よりも高い分類性能を達成した.本研究ではMVSを,階層クラスタリングとくに群平均法と組み合わせたクラスタリングアルゴリズムMVS-AVEを提案する.MVSはcosine類似度よりも複雑であるにもかかわらず,MVS-AVEはクラスタ間類似度を高速計算する工夫により,cosine類似度を利用した群平均法CS-AVEと同等の時間計算量で動作する.実文書データを用いた評価実験により,MVS-AVEが,CS-AVEと比べて計算時間をほとんど増やさずに分類精度を向上できることを示す.さらに,MVS-AVEはクラスタサイズ(各クラスタのメンバ数)の均衡性をコントロールする仕組みを容易に導入できるという面白い特徴を持つ. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The cosine similarity is a similarity measure useful for document clustering. The cosine similarity between two points is determined by the angle between their corresponding vectors which start from the origin. Recently, a new similarity measure called MVS (MultiViewpoint-based Similarity) which observes the vectors from multiple viewpoints is proposed. MVS is shown to outperform the cosine similarity, when they are combined with some non-hierarchical clustering algorithm. This paper proposes an agglomerative hierarchical clustering named as MVS-AVE which couples the average-link method with MVS. Despite MVS is more complex than the cosine similarity, MVS-AVE achieves the same time complexity as the average-link method with the cosine similarity because of an effort to compute the inter-cluster similarity efficiently. Experimentally in document clustering, MVS-AVE outputs more accurate clustering results than the average-link method with the cosine similarity almost without lengthening the running time. Interestingly, our algorithm can be expanded to control the size fairness among clusters. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 62,
号 3,
p. 936-945,
発行日 2021-03-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |