WEKO3
アイテム
WWW上の学術文書からのメタデータ抽出
https://ipsj.ixsq.nii.ac.jp/records/43012
https://ipsj.ixsq.nii.ac.jp/records/4301291c55657-3305-43c2-9349-1cb44ce96f16
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-03-22 | |||||||
タイトル | ||||||||
タイトル | WWW上の学術文書からのメタデータ抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Metadata Extraction from Scholarly Web Documents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院 | ||||||||
著者所属 | ||||||||
名古屋大学大学院 | ||||||||
著者所属 | ||||||||
名古屋大学大学院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nagoya University | ||||||||
著者名 |
杉木, 健二
× 杉木, 健二
|
|||||||
著者名(英) |
Kenji, Sugiki
× Kenji, Sugiki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 学術情報の電子化が進み,WWW上の学術情報リソースの高い流通性が求められており,これらのリソースに対する索引や目録としてメタデータを付与することが重要な課題となる.本論文では,WWW上の学術情報文書からメタデータを生成する方法について述べる.本研究では,NII限定子を用いてDublin Core Metadata Element Setを拡張したメタデータセットを用いた.まず,固有名詞情報やリンク元のアンカーテキストを手がかりに,大学内のWebページをタイプ判定し,タイプ別にヒューリスティックルールを用いてメタデータの生成する.名古屋大学Webサイト資源に対してメタデータ生成実験を行った結果,本手法の実現可能性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | By electronization of scientific information, the distributivity of the scholarly information resource on WWW is strongly required. It is becoming an important subject to give the metadata such as indexes and tables to these resources. This paper describes a method of generating the metadata from the scholarly document on WWW. This metadata is based on the metadata sets to which Dublin Core Metadata Element Set is extended by the schema of NII. First, by using information about the name entity and anchor texts of linked documents, the types of web pages are identified. Then, the metadata is generated using heuristic rules with each type. An experiment on metadata generation using Nagoya University Websites resources has shown the feasibility of our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10539261 | |||||||
書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2006, 号 33(2006-DD-054), p. 63-68, 発行日 2006-03-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |