WEKO3
アイテム
学と産の連携による基盤ソフトウェアの先進的開発:8.100億規模のWebページ収集・分析への挑戦
https://ipsj.ixsq.nii.ac.jp/records/62949
https://ipsj.ixsq.nii.ac.jp/records/629494000063d-a3f8-4fc1-9e94-41d3ba2ee829
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Magazine(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2008-11-15 | |||||||
| タイトル | ||||||||
| タイトル | 学と産の連携による基盤ソフトウェアの先進的開発:8.100億規模のWebページ収集・分析への挑戦 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Development of Advanced Development of Fundamental Software through Tight Collaboration of Academia and Industry:Challenges to Gathering and Analyzing over 10 Billion of Web Pages | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 特集 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | article | |||||||
| 著者所属 | ||||||||
| 早稲田大学理工学術院 | ||||||||
| 著者所属 | ||||||||
| 早稲田大学理工学術院 | ||||||||
| 著者所属 | ||||||||
| 米国富士通研究所 | ||||||||
| 著者所属 | ||||||||
| 富士通株式会社 | ||||||||
| 著者所属 | ||||||||
| 富士通株式会社 | ||||||||
| 著者所属 | ||||||||
| アクセラテクノロジ株式会社 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Waseda Univ. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Fujitsu Labs. of America, Inc | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Fujitsu Ltd. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Accela Technology Corp. | ||||||||
| 著者名 |
村岡, 洋一
山名, 早人
松井, くにお
橋本, 三奈子
赤羽匡子
萩原, 純一
× 村岡, 洋一 山名, 早人 松井, くにお 橋本, 三奈子 赤羽匡子 萩原, 純一
|
|||||||
| 著者名(英) |
Yoichi, MURAOKA
Hayato, YAMANA
Kunio, MATSUI
Minako, HASIMOTO
KyokoAKABANE
Junichi, HAGIWARA
× Yoichi, MURAOKA Hayato, YAMANA Kunio, MATSUI Minako, HASIMOTO KyokoAKABANE Junichi, HAGIWARA
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Webページ数は,2006年11月時点で537億ページと推測されている1).我々は,2004年1月--2006年7月の間に,全世界の5 548万台のWebサーバからテキストのみを対象に収集を行い,ユニークなWebページ数として約144.5億ページを収集した.また,収集済Webページに対して,トップレベルドメイン分布,記述言語分布,Webサーバの地理的位置の解析,バックリンク解析やPageRank計算を進め,Web空間の現状分析を行った.さらに,Webページの解析がビジネスに利用可能であることを示すために,企業のWebサイト上の活動を可視化するe企業調査プロトタイプを構築し,企業の特徴,戦略,評判などの抽出を行った. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN00116625 | |||||||
| 書誌情報 |
情報処理 巻 49, 号 11, p. 1277-1283, 発行日 2008-11-15 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||