WEKO3
アイテム
地域情報ウェブディレクトリの自動編集
https://ipsj.ixsq.nii.ac.jp/records/11869
https://ipsj.ixsq.nii.ac.jp/records/118693bb3bc3d-7c26-40c3-bfa2-1f6b6c0d02df
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-09-15 | |||||||
タイトル | ||||||||
タイトル | 地域情報ウェブディレクトリの自動編集 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automated Editing of a Web Directory of Regional Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | グループウェア | |||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科知能情報学専攻/科学技術振興事業団さきがけ研究21「情報と知」領域グループ | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Information Science, Japan Advanced Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University/"Information and Human Activity", PRESTO, JST | ||||||||
著者名 |
大槻, 洋輔
× 大槻, 洋輔
|
|||||||
著者名(英) |
Yousuke, Ohtsuki
× Yousuke, Ohtsuki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,地域情報ディレクトリを自動編集するシステムを提案する.本システムの主要な処理は,特定の地域に関する情報を提供するウェブサイト(地域サイト)の自動収集と,地域サイト内のウェブページの自動分類である.地域サイトの自動収集では,地域サイトのURLとして典型的に用いられるURLパターンを利用して地域サイトのリンク集を発見し,そこから未知の地域サイトのURLを収集する.ウェブページの自動分類では,ウェブページのタイトルやアンカテキストなどに現れるカテゴリ固有表現に基づき,ページを8種類のカテゴリに分類する.実験において,本システムは,日本の全地域(3 427自治体)の83.2%の地域に対して,地域サイトを1つ以上収集することができた.また,ウェブページの自動分類の再現率は71.4%,適合率は83.2%であった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a system that edits a web directory of regional information automatically.Two key technologies are automatic collection of regional web sites and automatic classification of web pages in the collected sites.The former finds existing link collections by using the URL prototype of regional web sites,and collects unknown regional web sites' URLs from these link collections.The latter classifies the pages in the regional web sites into eight categories.The categories of a page are determined by the category-specific expressions that exist in the page title and the anchor texts.In the experiment, the system collected 4,012 regional web sites in total;they cover 83.2 percent of all regions in Japan.The system achieved 71.4 percent recall and 83.2 percent precision in an open test of automatic classification. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 42, 号 9, p. 2310-2318, 発行日 2001-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |