WEKO3
アイテム
WWW文書における属性情報抽出の試み
https://ipsj.ixsq.nii.ac.jp/records/89012
https://ipsj.ixsq.nii.ac.jp/records/89012bc2ad865-8068-44e6-b9f0-94c05900b297
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1996 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1996-10-23 | |||||||
タイトル | ||||||||
タイトル | WWW文書における属性情報抽出の試み | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Experimental Report of automatic meta-info extraction from WWW documents | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
NTTソフトウェア研究所 | ||||||||
著者所属 | ||||||||
shimizu@ntt-20.ntt.jp | ||||||||
著者所属 | ||||||||
NTTソフトウェア研究所 | ||||||||
著者所属 | ||||||||
NTTソフトウェア研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Sortware Laboralories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Sortware Laboralories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Sortware Laboralories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Sortware Laboralories | ||||||||
著者名 |
清水, 奨
神林, 隆
佐藤, 進也
ポール, フランシス
× 清水, 奨 神林, 隆 佐藤, 進也 ポール, フランシス
|
|||||||
著者名(英) |
Susumu, Shimizu
Takashi, Kambayashi
Shin-ya, Sato
Paul, Francis
× Susumu, Shimizu Takashi, Kambayashi Shin-ya, Sato Paul, Francis
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | WWW上で提供される膨大な情報に対して、検索支援のニーズが高まっている。しかし、現在の検索システムの多くはそれぞれが収集した情報を個別にデータベース化しており、互換性は考えられていない。このため検索システムの数だけ収集ロボットが作られるといった非効率性が指摘されている。複数の検索システムの協調動作を実現するためには、収集した情報が持つさまざまな属性情報(文書タイプ、言語その他)を取り出し、共通に利用できるようにすることが重要である。本稿では、WWWで提供される文書を対象とし、属性情報を抽出するためのフレームワークについて述べる。属性の抽出を文書タイプの識別、言語の識別をはじめとする幾つかの工程にわけ、著者らが開発中の検索システムIngridにおける実装について述べる。また各々の工程における技術的な問題点と解決のためのアプローチを示す。 | |||||||
書誌情報 |
マルチメディア通信と分散処理ワークショップ論文集 巻 1996, 号 1, p. 499-505, 発行日 1996-10-23 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |