WEKO3
アイテム
単語統計情報と言語情報とを併用した新しい文書検索のモデル
https://ipsj.ixsq.nii.ac.jp/records/40682
https://ipsj.ixsq.nii.ac.jp/records/406823c963eb2-faa8-452e-96f7-c5cb8b931aff
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1996 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1996-11-21 | |||||||
タイトル | ||||||||
タイトル | 単語統計情報と言語情報とを併用した新しい文書検索のモデル | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A New IR Model Utilizing Word Statistics and Linguistic Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
松下電器産業(株)マルチメディアシステム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業(株)マルチメディアシステム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業(株)マルチメディアシステム研究所 | ||||||||
著者所属 | ||||||||
松下電器産業(株)マルチメディアシステム研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mutlimedia System Research Laboratory Matsushita Electric Industrial Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mutlimedia System Research Laboratory Matsushita Electric Industrial Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mutlimedia System Research Laboratory Matsushita Electric Industrial Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Mutlimedia System Research Laboratory Matsushita Electric Industrial Co., Ltd. | ||||||||
著者名 |
野口, 直彦
稲葉, 光昭
野本, 昌子
菅野祐司
× 野口, 直彦 稲葉, 光昭 野本, 昌子 菅野祐司
|
|||||||
著者名(英) |
Naohiko, Noguchi
Mitsuaki, Inaba
Masako, Nomoto
Yuji, Kanno
× Naohiko, Noguchi Mitsuaki, Inaba Masako, Nomoto Yuji, Kanno
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、WWW上での情報検索システムに代表されるように、部分一致(artial matc)モデルに基づく情報検索システムが実用化段階を迎えている。しかし、新聞検索・特許検索・文献検索など、比較的均一で大規模な情報に対する検索については、ランキングの適合率向上が必須である。本稿では、部分一致モデルに基づく検索システムの適合率の向上を目的として、単語統計情報と言語情報とを併用した新しい検索モデルを提案する。我々の提案する検索モデルでは、文書/検索質問の特徴量の表現、およびそれらの照合過程に、人間の文書検索過程についての内省から得られる知見を反映させる。また、我々は、新聞記事データを対象として、その検索モデルを実現する実験システムを構築した。実装においては、将来の実用化を意識し、索引作成速度/索引容量/検索速度の点で十分実用的なものになるように工夫した。本稿では、その実験システムの概要と、それを用いて行なった適合率の評価実験についても述べる。実験では、検索条件を注意深く入力することで、ランキングの上位において適合率が改善される可能性があることが確認された。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Information retrieval systems based on the partial match IR models are now in commercial use, especially in the field of World Wide Web search systems. In order to apply such IR systems to large and homogeneous data such as newspaper articles and patent documents, it is necessary to improve the effectiveness of the document ranking they produce. In this paper, we propose a new IR model which utilizes the linguistic information as well as words tatistics information to improve its effectiveness. To conceptualize the model, we examine and analyze the human process of selecting relevant documents. We have developed a search system for newspaper articles realizing proposed IR model. AI-though it is an experimental system, it can index and search giga-byte data in practical computational time and spaces. We address the implementation of the system briefly and show the results of some experiments on its retrieval effectiveness. The results show that it can improve the precision of the upper part of the document ranking when the queries are deliberately constructed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 1996, 号 116(1996-FI-044), p. 33-40, 発行日 1996-11-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |