WEKO3
アイテム
NMF とリンクベースの修正法によるピンポン型文書クラスタリング
https://ipsj.ixsq.nii.ac.jp/records/47824
https://ipsj.ixsq.nii.ac.jp/records/4782416b62495-cff4-43e1-a849-8ea3b8dcd3d5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-05-24 | |||||||
タイトル | ||||||||
タイトル | NMF とリンクベースの修正法によるピンポン型文書クラスタリング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Ping-Pong Document Clustering by using NMF and Linkage Based Refinement | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
茨城大学工学部情報工学科 | ||||||||
著者所属 | ||||||||
茨城大学工学部情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer and Information Sciences, Ibaraki University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Computer and Information Sciences, Ibaraki University | ||||||||
著者名 |
新納, 浩幸
佐々木, 稔
× 新納, 浩幸 佐々木, 稔
|
|||||||
著者名(英) |
Hiroyuki, Shinnou
Minoru, Sasaki
× Hiroyuki, Shinnou Minoru, Sasaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Non-negative Matrix Factorization (NMF) は効果的な文書クラスタリング手法である。本論文では NMF の精度をさらに高めるために、NMF とリンクベースの修正法を交互に適用するピンポン型文書クラスタリング手法を提案する。NMF をピンポン型で利用することで、効果的な文書クラスタリングが期待できるが、NMF は入力のクラスタリング結果を改善できない場合も多く、ピンポン型で利用すると悪影響も多い。ここでは、ピンポンの終了条件の設定でこの問題に対処する。具体的には、リンクベースの修正法の適用の後に、設定した評価関数の値が改善されたかどうかでピンポンの終了を判定する。もし改善されていなければ、ピンポンを終了し、前回のリンクベースの修正法を行った後の結果を最終的なクラスタリング結果とする。これによって、NMF を利用した効果的なピンポン型クラスタリングが可能となる。実験では 16個の文書データセットを利用して、本手法を k-means や NMF と比較した。基本となる NMF の結果を大きく改善できた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Non-negative Matrix Factorization (NMF) is a powerful document clustering method. This paper proposes a ping-pong document clustering method using NMF and the linkage based refinement alternately, in order to improve the clustering result of NMF. The use of NMF in the ping-pong strategy can be expected effective for document clustering. However, NMF in the ping-pong strategy often worsens performance because NMF often fails to improve the clustering result given as the initial values. Our method handles this problem with the stop condition of the ping-pong process. Concretely speaking, our method decides the stop/continue of the ping-pong process by the value of an object function for the clustering result produced by the linkage based refinement. If that value is not improved, our method stops the ping-pong process, and outputs the clustering result produced by the linkage based refinement in the previous ping-pong process. By this setting, our method can use NMF in the ping-pong strategy. In the experiment, we compared our method with the k-means and NMF by using 16 document data sets. Our method improved the clustering result of NMF significantly. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 47(2007-NL-179), p. 7-12, 発行日 2007-05-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |