ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. データベース(TOD)[電子情報通信学会データ工学研究専門委員会共同編集]
  3. Vol.48
  4. No.SIG14(TOD35)

トピックを考慮した大規模文書情報源からのレコード抽出

https://ipsj.ixsq.nii.ac.jp/records/17420
https://ipsj.ixsq.nii.ac.jp/records/17420
15f1cad4-65e2-4941-bc9a-3357b9397b15
名前 / ファイル ライセンス アクション
IPSJ-TOD4814010.pdf IPSJ-TOD4814010.pdf (431.7 kB)
Copyright (c) 2007 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2007-09-15
タイトル
タイトル トピックを考慮した大規模文書情報源からのレコード抽出
タイトル
言語 en
タイトル Record Extraction from Large-scale Text Resources Considering Topics
言語
言語 jpn
キーワード
主題Scheme Other
主題 研究論文
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
筑波大学システム情報工学研究科コンピュータサイエンス専攻
著者所属
名古屋大学情報連携基盤センター
著者所属
筑波大学システム情報工学研究科コンピュータサイエンス専攻/筑波大学計算科学研究センター
著者所属(英)
en
Department of Computer Science, Graduate School of Systems and Information Engineering, University of Tsukuba
著者所属(英)
en
Information Technology Center, Nagoya University
著者所属(英)
en
Department of Computer Science, Graduate School of Systems and Information Engineering, University of Tsukuba / Center for Computational Sciences, University of Tsukuba
著者名 張建偉 石川, 佳治 北川, 博之

× 張建偉 石川, 佳治 北川, 博之

張建偉
石川, 佳治
北川, 博之

Search repository
著者名(英) Jianwei, Zhang Yoshiharu, Ishikawa Hiroyuki, Kitagawa

× Jianwei, Zhang Yoshiharu, Ishikawa Hiroyuki, Kitagawa

en Jianwei, Zhang
Yoshiharu, Ishikawa
Hiroyuki, Kitagawa

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,大量のテキスト文書からのレコード抽出の研究が行われている.レコード抽出には次の課題が存在する.第1に,大量の文書を情報抽出の対象とした場合に多大な処理コストがかかる.第2に,抽出されたレコードが,必ずしもユーザが興味あるトピックと合致しないことがある.これに対し本稿では,ユーザの意図に合った情報を効率良く抽出するためのレコード抽出手法を提案する.本手法では,効果的な抽出のために,ユーザの意図に適合した情報を含んでいる可能性の高い文書群を特定する.その特定した文書群を優先的に抽出処理に利用することで処理コストの削減を目指す.また,それらの文書群から内容の関連が深いレコードを抽出することで高い抽出精度を達成する.実験結果により,提案手法が抽出精度の低下を防ぎつつ,処理コストの削減を実現できることを示す.
論文抄録(英)
内容記述タイプ Other
内容記述 In recent years, the research on record extraction from a large number of text documents is becoming popular. However, there still exist some problems in record extraction. 1) When a large number of documents are used for the target of information extraction, the process usually becomes very time-consuming. 2) It is also likely that extracted records may not pertain to the user's interest on the aspect of the topic. To address these problems, in this paper we propose a method for efficiently extracting those records whose topics are relevant to the user's interest. To improve the efficiency of the information extraction system, our method identifies documents from which useful records are probably extracted. Those selected documents are first processed in order to reduce processing cost. Moreover, from these documents user-desired records are apt to be extracted so that high extraction accuracy is obtained. Our experiments show that our system reduces the processing cost with achieving high extraction accuracy.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11464847
書誌情報 情報処理学会論文誌データベース(TOD)

巻 48, 号 SIG14(TOD35), p. 107-123, 発行日 2007-09-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7799
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 23:21:02.497532
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3