WEKO3
アイテム
有益な検索結果提示のための部分文書再構成手法の提案
https://ipsj.ixsq.nii.ac.jp/records/73774
https://ipsj.ixsq.nii.ac.jp/records/7377480bee0cd-49b7-49bf-81d8-a587f7a953f2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-03-25 | |||||||
タイトル | ||||||||
タイトル | 有益な検索結果提示のための部分文書再構成手法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Proposal of a Reconstruction Method to Return Well-informative Search Results | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 研究論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
同志社大学大学院文化情報学研究科 | ||||||||
著者所属 | ||||||||
同志社大学文化情報学部 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Culture and Information Science, Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Culture and Information Science, Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
欅, 惇志
× 欅, 惇志
|
|||||||
著者名(英) |
Atsushi, Keyaki
× Atsushi, Keyaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | XML 文書を対象とした情報検索では,文書単位よりも細かな粒度の部分文書を対象とした検索を行うことが可能である.従来の部分文書に対する検索技術では,各部分文書に対するクエリへの適合度の算出方法に焦点を当てているため,各適合度すなわちスコアリング結果から,検索結果である部分文書 1 つ 1 つをどのように構成するのかということに関しては十分に議論されてこなかった.しかしながら,各部分文書の持つスコアのみに依存した形での検索結果の提示方法では,1) 大きすぎる (不要な部分を含む) 粒度の部分文書が抽出される,2) 適合部分文書の一部しか抽出できない,といった問題が起こりうる.これらの問題を解決するため,我々は各部分文書のテキストサイズと部分文書間の包含関係を考慮した適合部分抽出手法を提案する.さらに,先祖や子孫の部分文書の統計量を考慮したスコアリング手法を提案し,情報要求に強く合致する部分文書を検索結果上位にランキングすることを目指す.評価実験の結果,提案手法は従来手法と比較して約 8% 検索精度が改善された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a method for identifying appropriate granular fragments for user information needs and obtaining more accurate search results in XML fragment search. Existing approaches simply generate a ranked list in descending order of each XML fragment's relevance to a search query. These approaches have problems, i.e., they may extract irrelevant fragments and overlook more relevant fragments. To address these problems, we generate a refined ranked list through two steps. First, we extract and reconstruct relevant fragments considering the sizes of XML fragments and relationships among XML fragments in a simple ranked list. Second, we score these XML fragments with useful statistics of its descendant/ancestor XML fragments. Our experimental results show that our method improves search accuracy by 8% compared with simple BM25E which neither reconstruct XML fragments nor use some kinds of statistics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 4, 号 1, p. 1-13, 発行日 2011-03-25 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |