有益な検索結果提示のための部分文書再構成手法の提案

欅, 惇志; 波多野, 賢治; 宮崎, 純; Atsushi, Keyaki; Kenji, Hatano; Jun, Miyazaki

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

有益な検索結果提示のための部分文書再構成手法の提案

https://ipsj.ixsq.nii.ac.jp/records/73774

名前 / ファイル	ライセンス	アクション
IPSJ-TOD0401002.pdf (1.0 MB)	Copyright (c) 2011 by the Information Processing Society of Japan
オープンアクセス

Item type

Trans(1)

公開日

2011-03-25

タイトル

有益な検索結果提示のための部分文書再構成手法の提案

タイトル

言語

タイトル

A Proposal of a Reconstruction Method to Return Well-informative Search Results

言語

jpn

キーワード

主題Scheme

Other

主題

研究論文

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_6501

資源タイプ

journal article

著者所属

同志社大学大学院文化情報学研究科

著者所属

同志社大学文化情報学部

著者所属

奈良先端科学技術大学院大学情報科学研究科

著者所属(英)

Graduate School of Culture and Information Science, Doshisha University

著者所属(英)

Faculty of Culture and Information Science, Doshisha University

著者所属(英)

Graduate School of Information Science, Nara Institute of Science and Technology

著者名

欅, 惇志

著者名(英)

Atsushi, Keyaki

論文抄録

内容記述タイプ

Other

内容記述

XML 文書を対象とした情報検索では，文書単位よりも細かな粒度の部分文書を対象とした検索を行うことが可能である．従来の部分文書に対する検索技術では，各部分文書に対するクエリへの適合度の算出方法に焦点を当てているため，各適合度すなわちスコアリング結果から，検索結果である部分文書 1 つ 1 つをどのように構成するのかということに関しては十分に議論されてこなかった．しかしながら，各部分文書の持つスコアのみに依存した形での検索結果の提示方法では，1) 大きすぎる（不要な部分を含む）粒度の部分文書が抽出される，2) 適合部分文書の一部しか抽出できない，といった問題が起こりうる．これらの問題を解決するため，我々は各部分文書のテキストサイズと部分文書間の包含関係を考慮した適合部分抽出手法を提案する．さらに，先祖や子孫の部分文書の統計量を考慮したスコアリング手法を提案し，情報要求に強く合致する部分文書を検索結果上位にランキングすることを目指す．評価実験の結果，提案手法は従来手法と比較して約 8% 検索精度が改善された．

論文抄録(英)

内容記述タイプ

Other

内容記述

We propose a method for identifying appropriate granular fragments for user information needs and obtaining more accurate search results in XML fragment search. Existing approaches simply generate a ranked list in descending order of each XML fragment's relevance to a search query. These approaches have problems, i.e., they may extract irrelevant fragments and overlook more relevant fragments. To address these problems, we generate a refined ranked list through two steps. First, we extract and reconstruct relevant fragments considering the sizes of XML fragments and relationships among XML fragments in a simple ranked list. Second, we score these XML fragments with useful statistics of its descendant/ancestor XML fragments. Our experimental results show that our method improves search accuracy by 8% compared with simple BM25E which neither reconstruct XML fragments nor use some kinds of statistics.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AA11464847

書誌情報

情報処理学会論文誌データベース（TOD）

巻 4, 号 1, p. 1-13, 発行日 2011-03-25

ISSN

収録物識別子タイプ

ISSN

収録物識別子

1882-7799

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 21:48:43.507415

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

有益な検索結果提示のための部分文書再構成手法の提案

× 欅, 惇志

× Atsushi, Keyaki

Versions

Share

Cite as

エクスポート