WEKO3
-
RootNode
アイテム
Webアーカイブにおける差分収集に用いるWebページの更新依存度分析
https://ipsj.ixsq.nii.ac.jp/records/69785
https://ipsj.ixsq.nii.ac.jp/records/6978502b7f1a3-88b1-465d-a0d4-944250c57812
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-07-05 | |||||||
タイトル | ||||||||
タイトル | Webアーカイブにおける差分収集に用いるWebページの更新依存度分析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Update Dependence Analysis of Web Pages for Incremental Crawling | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良女子大学大学院人間文化研究科 | ||||||||
著者所属 | ||||||||
奈良女子大学大学院人間文化研究科 | ||||||||
著者所属 | ||||||||
奈良女子大学大学院人間文化研究科 | ||||||||
著者所属 | ||||||||
奈良女子大学大学院人間文化研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Humanities and Sciences, Nara Women's University | ||||||||
著者名 |
廣道, 尚弓
吉井, 直子
高田, 雅美
城, 和貴
× 廣道, 尚弓 吉井, 直子 高田, 雅美 城, 和貴
|
|||||||
著者名(英) |
Naomi, Hiromichi
Naoko, Yoshii
Masami, Takata
Kazuki, Joe
× Naomi, Hiromichi Naoko, Yoshii Masami, Takata Kazuki, Joe
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 膨大な数の Web サイトが開設され、それらの多くが定期的、または不定期に更新されるため、Web アーカイブが重要となっている。そこで、Web クローラはいつ収集すべきかという問題に直面している。特に、差分収集は Web ページを収集するにあたり、収集間隔が重要な問題となる。本稿では、Interval Graph と Heap Tree 構造を用いて、差分収集に用いる適切な収集間隔を予測するための新たなモデルを提案する。そのモデルは Web ページの更新依存度を用いて Web サイトの更新間隔を推定する。モデルの予備実験は本稿で示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As huge number of web sites are created anywhere, Web archiving is an important task since most Web sites are updated periodically or non periodically. Any web crawler faces to the problem of ”When should we collect?”. Especially, incremental crawling has an essential problem of time interval for web page collections. In this paper, we propose a new model to predict the appropriate interval time for incremental web crawling by using an extended interval graph and heap tree structures. The model estimates the update interval of web pages in a web site with the information of modification dependence information of the web pages. Preliminary experiment of the model is shown in the paper. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2010-MPS-79, 号 8, p. 1-6, 発行日 2010-07-05 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |