WEKO3
アイテム
特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去
https://ipsj.ixsq.nii.ac.jp/records/92744
https://ipsj.ixsq.nii.ac.jp/records/927442f956142-0898-42a8-9beb-2df999d8328d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-06-28 | |||||||
タイトル | ||||||||
タイトル | 特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Document Cluster Purification for Feature Extraction | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [研究論文] 文書クラタスタリング,特徴語抽出,凝集型階層的クラスタリング,k平均法,コミュニティ抽出,LDA | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories, NTT Corporation | ||||||||
著者名 |
佐藤, 進也
× 佐藤, 進也
|
|||||||
著者名(英) |
Shin-ya, Sato
× Shin-ya, Sato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | クラスタリングにより文書集合を意味的に分類し,それぞれの特徴を表す情報(特徴語)を抽出するという目的のため,クラスタリング結果を改善する方法を考案した.本手法では,各クラスタから,いわゆるノイズと呼ばれるような,クラスタを構成する文書集合の意味的一貫性を阻害する要素を除去する.除去する文書を決定するためには,別のアルゴリズムで得たクラスタリング結果を利用する.これにより,従来埋もれていた特徴語の発見が可能になる.本手法の有効性を確認するため,Q&Aサイトのページを集めて文書集合を作成し,そのクラスタリング結果から特徴的な場所を抽出する(たとえば,バーベキューに関する質問のクラスタから「公園」といった場所を抽出する)実験を行った.10個の文書集合を作成し,それぞれに対して提案手法を適用した結果,延べ百数十の場所が新たに得られた.また,本手法は質問に対して意外な関連性のある場所を抽出する傾向があることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | For effectively extracting features from document clusters, we developed a technique for improving the quality of the clustering results, which purifies original clusters (i.e., eliminates unwanted elements in each cluster) by using the outcome from another clustering algorithm. For verifying the effectiveness of the proposed approach, we conducted an experiment to discover associations between document clusters and their characteristic places using pages in a social Q&A site (e.g., associate “park” with a document cluster of questions about barbecues). We obtained a hundred and several tens of places in total by applying the proposed approach to 10 document sets. Futhermore, we observed a tendency that the approach discovered unexpected associations. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 6, 号 3, p. 1-12, 発行日 2013-06-28 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |