WEKO3
アイテム
CONCORによるリンク解析を用いたWeb文書からの重要語抽出
https://ipsj.ixsq.nii.ac.jp/records/50183
https://ipsj.ixsq.nii.ac.jp/records/50183b7eba532-dadb-493f-82d5-ef44a9dfc51c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-07-28 | |||||||
タイトル | ||||||||
タイトル | CONCORによるリンク解析を用いたWeb文書からの重要語抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Web Documents Summarization using Link Analysis Based on CONCOR | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
大阪大学大学院 情報科学研究科情報数理学専攻 | ||||||||
著者所属 | ||||||||
大阪大学産業科学研究所 知能システム科学研究部門 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Physical Science, Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Institute of Science and Industrial Research, Osaka University | ||||||||
著者名 |
山下, 長義
× 山下, 長義
|
|||||||
著者名(英) |
Nagayoshi, Yamashita
× Nagayoshi, Yamashita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文ではWebにおいて他のサイトとのリンクパターンが等しいサイトは内容的にも等しいのではないかと考え,リンクパターンが等しいサイト間で比較を行うことでWebページから重要語抽出する手法を提案する.まず,CONCORでサイト間のリンク関係を表すネットワークをクラスタに分割し,提案手法によってそれぞれのサイトに対する類似サイトを特定する.そして,CONCORにより分割された同一クラスタ内のサイト間に共通して出現する名詞とそれぞれのサイトとそれらに対する類似サイト間に共通して出現する名詞の重み付けを補正する.リンク構造を言語処理に反映することで重要語抽出をおこない,従来手法よりよい結果が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a framework to extracting significant words in the Web using link structure.We use the global method in social network 'CONCOR' for link analysis. This is based on the assumption that if the link patterns of two sites and links are the same, then these two sites also contain the same in contents. In the first phase, the whole network consisting of sites are divided into clusters using CONCOR.Subsequently, by using the method we propose, we identify similarity sites.Comparing a site with other sites in the same cluster and with the similarity sites for the site, we assign higher weights to nouns that exist in two sites in common.By using link analysis to language processing, we could discover significant words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2006, 号 84(2006-ICS-144), p. 1-6, 発行日 2006-07-28 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |