@techreport{oai:ipsj.ixsq.nii.ac.jp:00040682, author = {野口, 直彦 and 稲葉, 光昭 and 野本, 昌子 and 菅野祐司 and Naohiko, Noguchi and Mitsuaki, Inaba and Masako, Nomoto and Yuji, Kanno}, issue = {116(1996-FI-044)}, month = {Nov}, note = {近年、WWW上での情報検索システムに代表されるように、部分一致(artial matc)モデルに基づく情報検索システムが実用化段階を迎えている。しかし、新聞検索・特許検索・文献検索など、比較的均一で大規模な情報に対する検索については、ランキングの適合率向上が必須である。本稿では、部分一致モデルに基づく検索システムの適合率の向上を目的として、単語統計情報と言語情報とを併用した新しい検索モデルを提案する。我々の提案する検索モデルでは、文書/検索質問の特徴量の表現、およびそれらの照合過程に、人間の文書検索過程についての内省から得られる知見を反映させる。また、我々は、新聞記事データを対象として、その検索モデルを実現する実験システムを構築した。実装においては、将来の実用化を意識し、索引作成速度/索引容量/検索速度の点で十分実用的なものになるように工夫した。本稿では、その実験システムの概要と、それを用いて行なった適合率の評価実験についても述べる。実験では、検索条件を注意深く入力することで、ランキングの上位において適合率が改善される可能性があることが確認された。, Information retrieval systems based on the partial match IR models are now in commercial use, especially in the field of World Wide Web search systems. In order to apply such IR systems to large and homogeneous data such as newspaper articles and patent documents, it is necessary to improve the effectiveness of the document ranking they produce. In this paper, we propose a new IR model which utilizes the linguistic information as well as words tatistics information to improve its effectiveness. To conceptualize the model, we examine and analyze the human process of selecting relevant documents. We have developed a search system for newspaper articles realizing proposed IR model. AI-though it is an experimental system, it can index and search giga-byte data in practical computational time and spaces. We address the implementation of the system briefly and show the results of some experiments on its retrieval effectiveness. The results show that it can improve the precision of the upper part of the document ranking when the queries are deliberately constructed.}, title = {単語統計情報と言語情報とを併用した新しい文書検索のモデル}, year = {1996} }