WEKO3
アイテム
Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み
https://ipsj.ixsq.nii.ac.jp/records/48258
https://ipsj.ixsq.nii.ac.jp/records/4825818490526-c911-4274-9f68-5aabc1169994
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-09-29 | |||||||
タイトル | ||||||||
タイトル | Webコンテンツの分析に基づくオントロジ構築および属性抽出の試み | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Ontology Construction and Extraction of Template Elements from Web Contents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
沖電気工業株式会社研究開発本部 | ||||||||
著者所属 | ||||||||
沖電気工業株式会社研究開発本部 | ||||||||
著者所属 | ||||||||
沖電気工業株式会社研究開発本部 | ||||||||
著者所属 | ||||||||
沖電気工業株式会社研究開発本部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Oki Electric Industry Co.,Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Oki Electric Industry Co.,Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Oki Electric Industry Co.,Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Oki Electric Industry Co.,Ltd. | ||||||||
著者名 |
大沼, 宏行
松平, 正樹
渕上, 正睦
森田, 幸伯
× 大沼, 宏行 松平, 正樹 渕上, 正睦 森田, 幸伯
|
|||||||
著者名(英) |
Hiroyuki, Ohnuma
Masaki, Matsudaira
Masachika, Fuchigami
Yukihiro, Morita
× Hiroyuki, Ohnuma Masaki, Matsudaira Masachika, Fuchigami Yukihiro, Morita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,Web上にあるコンテンツの「意味」を取り扱う技術として,セマンティックWebが注目されているが,Web上のコンテンツに「意味」をつけるメタデータの付与は課題になっている.本稿では,HTML文書にメタデータを付与する作業を支援するために,あらかじめ設定されたRDFスキーマに基づいて,メタデータを半自動に付与する方法について述べる.すなわち,抽出したい属性を,クラスとその属性という関係で構成し,ある属性が他のクラスを指し示すというRDF Schemaのクラス-属性の関係で表現する.そして,個々のコンテンツのどの部分が,それらの属性に対応しているのかを抽出する.Webコンテンツでは,個々の属性を表す見出し語がついていないことが多いため,それを考慮して属性抽出を行う.講演会などのイベント情報について属性抽出を行い,その結果,適合率で0.63 再現率で0.56が得られた.これらの指標をともに高めることが今後の課題である. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, semantic web is one of the most interesting topics as the technology for representing the "semantics " of web contents. In order to spread out semantic web, it is necessary to attach meta-data to web contents. However it is difficult to attach meta-data from existing web contents by hand. We have analyzed web contents in order to construct ontology and developed the tool to support attachment of meta-data. We can utilize the information extraction technology for attachment of meta-data. Namely, our tool assigns extracted named entities such as person name, place, date and so on, to attributes such as lecturers, meeting places and so on . The relations of attributes are represented as the RDF schema. As the evaluation results, we get a recall score of 0.63 and a precision score of 0.56. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2003, 号 98(2003-NL-157), p. 49-54, 発行日 2003-09-29 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |