WEKO3
アイテム
Webサイトの自動分類に向けた特徴分析とキーワード抽出に関する研究
https://ipsj.ixsq.nii.ac.jp/records/50222
https://ipsj.ixsq.nii.ac.jp/records/50222935b5d13-8ae7-4b0d-b4df-3ebf07b54417
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-08-01 | |||||||
タイトル | ||||||||
タイトル | Webサイトの自動分類に向けた特徴分析とキーワード抽出に関する研究 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Feature Analysis and Keyword Extraction for Automatic Classification of Web site | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
北海道大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Hokkaido University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Hokkaido University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Hokkaido University | ||||||||
著者名 |
本田, 崇智
× 本田, 崇智
|
|||||||
著者名(英) |
Takatomo, HONDA
× Takatomo, HONDA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Webサイトは、ディレクトリ型検索エンジンでも見られるように様々なカテゴリーに属している。一方Webサイトには、画造ファイルやリンク、テキストデータなどといった多くの情報が存在する。このような情報から得られる特徴やサイト中に含まれるキーワードによって、Webサイトはカテゴリーへと自動分類することが可能であると考えられる。そこで本研究では、宿泊施設や飲食店など観光に関するカテゴリーを対象とし、各カテゴリーごとに特異的にみられるWebサイトの特徴やキーワードの抽出を行い、それらを用いて自動分類の評価を行う。本手法が確立されれば、任意のWebサイトをカテゴリーに自動分類することが可能になると考えられる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A website is considered to be belonging to a certain category such as accommodations, restaurants, facilities and so on, as shown in the directory-typed search engines. Generally, a website includes valuable information such as links to or from other sites, many files with extensions and many text data, in terms of the category classification. In this paper, we investigates whether many websites belonging to certain category have some common features or not. In particular, we show that some keywords are very important to classify websites to the categories. By using these analyzed keyword information, we present that many websites could be classified to an appropriate category with high precision when three categories (museum, restaurant and accommodations) related to tourism are treated as examples. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2005, 号 78(2005-ICS-140), p. 1-4, 発行日 2005-08-01 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |