WEKO3
アイテム
学と産の連携による基盤ソフトウェアの先進的開発:8.100億規模のWebページ収集・分析への挑戦
https://ipsj.ixsq.nii.ac.jp/records/62949
https://ipsj.ixsq.nii.ac.jp/records/629494000063d-a3f8-4fc1-9e94-41d3ba2ee829
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Magazine(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-11-15 | |||||||
タイトル | ||||||||
タイトル | 学と産の連携による基盤ソフトウェアの先進的開発:8.100億規模のWebページ収集・分析への挑戦 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Development of Advanced Development of Fundamental Software through Tight Collaboration of Academia and Industry:Challenges to Gathering and Analyzing over 10 Billion of Web Pages | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | article | |||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属 | ||||||||
早稲田大学理工学術院 | ||||||||
著者所属 | ||||||||
米国富士通研究所 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
富士通株式会社 | ||||||||
著者所属 | ||||||||
アクセラテクノロジ株式会社 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Waseda Univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Labs. of America, Inc | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Accela Technology Corp. | ||||||||
著者名 |
村岡, 洋一
× 村岡, 洋一
|
|||||||
著者名(英) |
Yoichi, MURAOKA
× Yoichi, MURAOKA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Webページ数は,2006年11月時点で537億ページと推測されている1).我々は,2004年1月--2006年7月の間に,全世界の5 548万台のWebサーバからテキストのみを対象に収集を行い,ユニークなWebページ数として約144.5億ページを収集した.また,収集済Webページに対して,トップレベルドメイン分布,記述言語分布,Webサーバの地理的位置の解析,バックリンク解析やPageRank計算を進め,Web空間の現状分析を行った.さらに,Webページの解析がビジネスに利用可能であることを示すために,企業のWebサイト上の活動を可視化するe企業調査プロトタイプを構築し,企業の特徴,戦略,評判などの抽出を行った. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116625 | |||||||
書誌情報 |
情報処理 巻 49, 号 11, p. 1277-1283, 発行日 2008-11-15 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |