WEKO3
アイテム
特徴要素の重みを考慮に入れたクラスタ代表の洗練による文書クラスタリング
https://ipsj.ixsq.nii.ac.jp/records/43163
https://ipsj.ixsq.nii.ac.jp/records/431637de631f3-6ae5-4d15-84bf-74c041483bb3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-03-15 | |||||||
タイトル | ||||||||
タイトル | 特徴要素の重みを考慮に入れたクラスタ代表の洗練による文書クラスタリング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Refining Cluster Centroids based on Feature Significance for Efficient Document Clustering | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
広島大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
広島大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
広島大学大学院工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Hiroshima University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Hiroshima University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Hiroshima University | ||||||||
著者名 |
小林, 優
× 小林, 優
|
|||||||
著者名(英) |
Yu, Kobayashi
× Yu, Kobayashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では、利用者の分類に対する意図をクラスタリング結果に反映させ、かつ、文書クラスタリングを効率よく行うために、適切なクラスタ代表を求める手法を提案する。本手法では、利用者の分類例示に基づいて形成されるクラスタの主題を表す特徴要素を多く含む文書をサンプルとして選出し、そのサンプルをクラスタに追加することで、クラスタ代表の算出を行う。ここで、追加されたサンプルによっては、適切なクラスタ代表を求めることができない場合があるため、サンプルの追加と除去、クラスタ代表の算出を繰り返し行うことによって、クラスタ代表を洗練する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a method of refining cluster centroids to reflect user's intention to a clus-tering result and perform document clustering efficiently. In the proposed method, a cluster is formed based on a classification example, and a document which contains many features showing a subject of the cluster is selected as a sample and added to the cluster. Since a sample may be inappropriate for the cluster, addition and removal of a sample are iterated in order to refine the cluster centroid. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10539261 | |||||||
書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2002, 号 28(2001-DD-032), p. 135-142, 発行日 2002-03-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |