ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. データベース(TOD)[電子情報通信学会データ工学研究専門委員会共同編集]
  3. Vol.6
  4. No.3

特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去

https://ipsj.ixsq.nii.ac.jp/records/92744
https://ipsj.ixsq.nii.ac.jp/records/92744
2f956142-0898-42a8-9beb-2df999d8328d
名前 / ファイル ライセンス アクション
IPSJ-TOD0603002.pdf IPSJ-TOD0603002.pdf (670.0 kB)
Copyright (c) 2013 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2013-06-28
タイトル
タイトル 特徴抽出を目的とした文書クラスタからの一貫性阻害要素除去
タイトル
言語 en
タイトル Document Cluster Purification for Feature Extraction
言語
言語 jpn
キーワード
主題Scheme Other
主題 [研究論文] 文書クラタスタリング,特徴語抽出,凝集型階層的クラスタリング,k平均法,コミュニティ抽出,LDA
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
NTT未来ねっと研究所
著者所属
NTT未来ねっと研究所
著者所属
NTT未来ねっと研究所
著者所属(英)
en
NTT Network Innovation Laboratories, NTT Corporation
著者所属(英)
en
NTT Network Innovation Laboratories, NTT Corporation
著者所属(英)
en
NTT Network Innovation Laboratories, NTT Corporation
著者名 佐藤, 進也 高橋, 公海 松尾, 真人

× 佐藤, 進也 高橋, 公海 松尾, 真人

佐藤, 進也
高橋, 公海
松尾, 真人

Search repository
著者名(英) Shin-ya, Sato Masami, Takahashi Masato, Matsuo

× Shin-ya, Sato Masami, Takahashi Masato, Matsuo

en Shin-ya, Sato
Masami, Takahashi
Masato, Matsuo

Search repository
論文抄録
内容記述タイプ Other
内容記述 クラスタリングにより文書集合を意味的に分類し,それぞれの特徴を表す情報(特徴語)を抽出するという目的のため,クラスタリング結果を改善する方法を考案した.本手法では,各クラスタから,いわゆるノイズと呼ばれるような,クラスタを構成する文書集合の意味的一貫性を阻害する要素を除去する.除去する文書を決定するためには,別のアルゴリズムで得たクラスタリング結果を利用する.これにより,従来埋もれていた特徴語の発見が可能になる.本手法の有効性を確認するため,Q&Aサイトのページを集めて文書集合を作成し,そのクラスタリング結果から特徴的な場所を抽出する(たとえば,バーベキューに関する質問のクラスタから「公園」といった場所を抽出する)実験を行った.10個の文書集合を作成し,それぞれに対して提案手法を適用した結果,延べ百数十の場所が新たに得られた.また,本手法は質問に対して意外な関連性のある場所を抽出する傾向があることが分かった.
論文抄録(英)
内容記述タイプ Other
内容記述 For effectively extracting features from document clusters, we developed a technique for improving the quality of the clustering results, which purifies original clusters (i.e., eliminates unwanted elements in each cluster) by using the outcome from another clustering algorithm. For verifying the effectiveness of the proposed approach, we conducted an experiment to discover associations between document clusters and their characteristic places using pages in a social Q&A site (e.g., associate “park” with a document cluster of questions about barbecues). We obtained a hundred and several tens of places in total by applying the proposed approach to 10 document sets. Futhermore, we observed a tendency that the approach discovered unexpected associations.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11464847
書誌情報 情報処理学会論文誌データベース(TOD)

巻 6, 号 3, p. 1-12, 発行日 2013-06-28
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7799
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 14:45:45.581945
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3