WEKO3
アイテム
実データの分析に基づくクラスタリングパラメータの設定法に関する検討
https://ipsj.ixsq.nii.ac.jp/records/18932
https://ipsj.ixsq.nii.ac.jp/records/1893227c81ecb-c7c2-46ab-99ff-2ecf92571650
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2006-07-14 | |||||||
| タイトル | ||||||||
| タイトル | 実データの分析に基づくクラスタリングパラメータの設定法に関する検討 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Parameter Setting for a Clustering Method through an Analytical Study of Real Data | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 筑波大学大学院システム情報工学研究科 | ||||||||
| 著者所属 | ||||||||
| 名古屋大学情報連携基盤センター | ||||||||
| 著者所属 | ||||||||
| 筑波大学大学院システム情報工学研究科 筑波大学計算科学研究センター | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Information Technology Center, Nagoya University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Systems and Information Engineering, University of Tsukuba,Center for Computational Sciences, University of Tsukuba | ||||||||
| 著者名 |
キー, ソァポァン
石川, 佳治
北川, 博之
× キー, ソァポァン 石川, 佳治 北川, 博之
|
|||||||
| 著者名(英) |
Sophoin, Khy
Yoshiharu, Ishikawa
Hiroyuki, Kitagawa
× Sophoin, Khy Yoshiharu, Ishikawa Hiroyuki, Kitagawa
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | これまで,我々のグループでは新規性に基づくクラスタリング法に関する研究を進めてきた.このクラスタリング手法では,最近のトピックの傾向を反映したクラスタリング結果を生成することを目的としている.このクラスタリング法の課題として,時間の経過につれて文書の価値がどの程度減少するかという指数的忘却係数をどのように設定するかという問題があった.これまでのアプローチでは,ユーザからただ一つの忘却パラメータが与えられ,どのようなカテゴリの文書についてもその一つの値が適用されていた.これに対し,この論文では実データをもとにした分析を行う.カテゴリのタイプに依存して,文書の忘却の仕方にどの程度違いがあるかを検証する. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In our previous papers, we have proposed a novelty-based document clustering method. The clustering method generates clusters reflecting current trend of recent topics. However, the problem with this clustering method is the setting of the exponential decaying factor parameter through which a document loses its value as time passes. In the clustering method, the parameter value is assumed a user-specified parameter and only one value is used for all types of documents regardless of which categories they are in. In this paper, we will show an analytical study on the real dataset. The objective of this study is to find the relationship between the decaying behavior of each document with their corresponding category types which will be helpful in the setting of parameter values in the novelty-based document clustering method. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2006, 号 78(2006-DBS-140), p. 375-381, 発行日 2006-07-14 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||