ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. データベースシステム(DBS)※2025年度よりデータベースとデータサイエンス(DBS)研究会に名称変更
  3. 2007
  4. 54(2007-DBS-142)

共起語に基づいた階層型文書クラスタリング手法

https://ipsj.ixsq.nii.ac.jp/records/18842
https://ipsj.ixsq.nii.ac.jp/records/18842
23bbdc3f-496e-4ec2-9ba0-bda5bf5782da
名前 / ファイル ライセンス アクション
IPSJ-DBS07142003.pdf IPSJ-DBS07142003.pdf (646.6 kB)
Copyright (c) 2007 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2007-05-31
タイトル
タイトル 共起語に基づいた階層型文書クラスタリング手法
タイトル
言語 en
タイトル A Hierarchical Document Clustering Method Based on Co-occurence Words
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京工業大学総合研究院
著者所属
東京工業大学総合研究院
著者所属
東京工業大学総合研究院
著者所属
東京工業大学総合研究院
著者所属
東京工業大学総合研究院
著者所属(英)
en
Integrated Research Institute, Tokyo Institute of Technology
著者所属(英)
en
Integrated Research Institute, Tokyo Institute of Technology
著者所属(英)
en
Integrated Research Institute, Tokyo Institute of Technology
著者所属(英)
en
Integrated Research Institute, Tokyo Institute of Technology
著者所属(英)
en
Integrated Research Institute, Tokyo Institute of Technology
著者名 村上, 浩司 橋本, 泰一 乾, 孝司 内海, 和夫 石川, 正道

× 村上, 浩司 橋本, 泰一 乾, 孝司 内海, 和夫 石川, 正道

村上, 浩司
橋本, 泰一
乾, 孝司
内海, 和夫
石川, 正道

Search repository
著者名(英) MURAKAMI, Koji HASHIMOTO, Taiichi INUI, Takashi UTSUMI, Kazuo ISHIKAWA, Masamichi

× MURAKAMI, Koji HASHIMOTO, Taiichi INUI, Takashi UTSUMI, Kazuo ISHIKAWA, Masamichi

en MURAKAMI, Koji
HASHIMOTO, Taiichi
INUI, Takashi
UTSUMI, Kazuo
ISHIKAWA, Masamichi

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究は、クラスタ毎の重要な数文書のみを効率よく提示することを目的とし、文書-単語マトリクスの代わりに単語-文書行列を入力として、まず単語をクラスタリングし、それらの単語を含む文書を間接的にクラスタリングする文書クラスタリング手法を提案する。提案手法は文書クラスタリングの際に、入力行列に用いた単語の tf・idf 値に基づいたスコアリングにより各文書クラスタに所属する文書をランキングし、その上位の文書のみを出力とすることで、クラスタの特徴を表す文書を同定できる利点がある。提案手法によって得られた各クラスタの上位ランクの文書は、他クラスタの文書とは排他的な特徴を持ちつつ、高い精度でクラスタリングされていることが確認された。
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we report the results of our investigation of the new document clustering approach which is based on term-document matrix instead of document-term matrix. In our clustering approach, the terms are clustered by considering co-occurence words among documents. At the time, the documents are also clustered indirectly because the documents include the classfied terms. The documents in each cluster are ranked by weighting of terms. This process is able to identify the documents which charactelize the cluster. In this paper, we show higher clustering performance than general document clustering approach.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10112482
書誌情報 情報処理学会研究報告データベースシステム(DBS)

巻 2007, 号 54(2007-DBS-142), p. 13-20, 発行日 2007-05-31
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 22:31:46.238252
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3