WEKO3
アイテム
Webページ集合からのWebページのコンテンツと構造を用いたクラスタリングによるトピックマップの抽出
https://ipsj.ixsq.nii.ac.jp/records/50132
https://ipsj.ixsq.nii.ac.jp/records/501329fc61b98-a49e-4498-8e0d-d840bfd2bc1f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-07-04 | |||||||
タイトル | ||||||||
タイトル | Webページ集合からのWebページのコンテンツと構造を用いたクラスタリングによるトピックマップの抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extracting Topic Maps from Web histories by clustering with Web structure and contents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科 | ||||||||
著者所属 | ||||||||
国立情報学研究所,総合研究大学院大学 | ||||||||
著者所属 | ||||||||
東京工業大学大学院総合理工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IGSE, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics, SOKENDAI | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IGSE, Tokyo Institute of Technology | ||||||||
著者名 |
間瀬, 心博
× 間瀬, 心博
|
|||||||
著者名(英) |
Motohiro, Mase
× Motohiro, Mase
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,Webページ集合からトピックマップを半自動で抽出する手法を提案する.従来のネットワーク構造に注目したクラスタリング手法に,Webページのコンテンツによる類似度,Webサイトのディレクトリ構造とWebページ間のリンクを利用した重み付けを導入する.Webページ間のリンクに内包されるトピックの関係を考慮し,WebサイトのディレクトリからWebページ間のリンクの意味を推定することで,Webページの集合からトピックだけでなくトピックの関連も併せて抽出する.Webユーザのブラウジング履歴から生成したWebページセットから,従来のクラスタリング手法と提案手法を用いてトピックマップを抽出し比較することで,提案手法の検証を行う. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we describe a method to semi-automatically extract Topic Maps from a set of Web pages. We introduce the following two points to the existing clustering method: The first is merging only the linked Web pages, to extract the underlying relationship of the topics. The second is introducing the contents similarity of Web pages and the weights that are based on the types of links and the distance between the directories in which the pages are located, to generate dense clusters. To evaluate the extracted topic maps and proposed method, we conduct experiment for comparing our method and the existing clustering method. We show the effectiveness of our approach using similarities of contents and weights from Web structure information. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2007, 号 67(2007-ICS-148), p. 53-60, 発行日 2007-07-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |