ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング


インデックスリンク

インデックスツリー

  • RootNode

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 数理モデル化と問題解決(MPS)
  3. 2010
  4. 2010-MPS-079

Webアーカイブにおける差分収集に用いるWebページの更新依存度分析

https://ipsj.ixsq.nii.ac.jp/records/69785
https://ipsj.ixsq.nii.ac.jp/records/69785
02b7f1a3-88b1-465d-a0d4-944250c57812
名前 / ファイル ライセンス アクション
IPSJ-MPS10079008.pdf IPSJ-MPS10079008.pdf (597.1 kB)
Copyright (c) 2010 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2010-07-05
タイトル
タイトル Webアーカイブにおける差分収集に用いるWebページの更新依存度分析
タイトル
言語 en
タイトル Update Dependence Analysis of Web Pages for Incremental Crawling
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
奈良女子大学大学院人間文化研究科
著者所属
奈良女子大学大学院人間文化研究科
著者所属
奈良女子大学大学院人間文化研究科
著者所属
奈良女子大学大学院人間文化研究科
著者所属(英)
en
Graduate School of Humanities and Sciences, Nara Women's University
著者所属(英)
en
Graduate School of Humanities and Sciences, Nara Women's University
著者所属(英)
en
Graduate School of Humanities and Sciences, Nara Women's University
著者所属(英)
en
Graduate School of Humanities and Sciences, Nara Women's University
著者名 廣道, 尚弓 吉井, 直子 高田, 雅美 城, 和貴

× 廣道, 尚弓 吉井, 直子 高田, 雅美 城, 和貴

廣道, 尚弓
吉井, 直子
高田, 雅美
城, 和貴

Search repository
著者名(英) Naomi, Hiromichi Naoko, Yoshii Masami, Takata Kazuki, Joe

× Naomi, Hiromichi Naoko, Yoshii Masami, Takata Kazuki, Joe

en Naomi, Hiromichi
Naoko, Yoshii
Masami, Takata
Kazuki, Joe

Search repository
論文抄録
内容記述タイプ Other
内容記述 膨大な数の Web サイトが開設され、それらの多くが定期的、または不定期に更新されるため、Web アーカイブが重要となっている。そこで、Web クローラはいつ収集すべきかという問題に直面している。特に、差分収集は Web ページを収集するにあたり、収集間隔が重要な問題となる。本稿では、Interval Graph と Heap Tree 構造を用いて、差分収集に用いる適切な収集間隔を予測するための新たなモデルを提案する。そのモデルは Web ページの更新依存度を用いて Web サイトの更新間隔を推定する。モデルの予備実験は本稿で示す。
論文抄録(英)
内容記述タイプ Other
内容記述 As huge number of web sites are created anywhere, Web archiving is an important task since most Web sites are updated periodically or non periodically. Any web crawler faces to the problem of ”When should we collect?”. Especially, incremental crawling has an essential problem of time interval for web page collections. In this paper, we propose a new model to predict the appropriate interval time for incremental web crawling by using an extended interval graph and heap tree structures. The model estimates the update interval of web pages in a web site with the information of modification dependence information of the web pages. Preliminary experiment of the model is shown in the paper.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10505667
書誌情報 研究報告数理モデル化と問題解決(MPS)

巻 2010-MPS-79, 号 8, p. 1-6, 発行日 2010-07-05
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 23:46:44.808119
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

城, 和貴, 2010: 情報処理学会, 1–6 p.

Loading...

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3