WEKO3
アイテム
インクリメンタルPageRankによる重要Webページの効率的な収集戦略
https://ipsj.ixsq.nii.ac.jp/records/18474
https://ipsj.ixsq.nii.ac.jp/records/18474a2948a55-1438-4e89-a703-1d87622387ba
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-10-15 | |||||||
タイトル | ||||||||
タイトル | インクリメンタルPageRankによる重要Webページの効率的な収集戦略 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Collection Strategies of Important Web Pages by Incremental PageRank | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | WWW | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
科学技術振興機構 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Science and Technology Agency | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Communication Engineering, Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Frontier Informatics, Graduate School of Frontier Sciences, The University of Tokyo | ||||||||
著者名 |
山田, 雅信
× 山田, 雅信
|
|||||||
著者名(英) |
Masanobu, Yamada
× Masanobu, Yamada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | サーチエンジンのインデックスやデータベースを構築するために,今日ではWebクローラが広く利用されている.しかし,すべてのWebページを十分な頻度で収集することは困難であるため,重要なWebページを効率的に収集することが重要となる.本論文では,小さなオーバヘッドで重要なWebページを高速に収集可能なクローラの収集戦略を提案する.さらに,我々の収集戦略によるクローラと従来の収集戦略によるクローラにより,WWWのサブセット上でWebページの収集実験を行い,我々の収集戦略の有効性を確認した.また,我々の収集戦略は少ないオーバヘッドで実装でき,クローラの速度を遅くするものではないことが確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Many search engines today use web crawlers to collect and index web pages. Since collecting all the Web pages in a reasonable amount of time is nearly impossible, crawlers should collect important Web pages efficiently. In this paper, we propose a small-overhead strategy that guides crawlers to important web pages fast. Experimental results show our strategy improves previously known starategies. It is also confirmed that our strategy can be implemented with a small overhead, so it does not drag the crawling speed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 45, 号 SIG11(ACS7), p. 465-473, 発行日 2004-10-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |