WEKO3
アイテム
複合語マッチングと共起情報を併用する情報検索
https://ipsj.ixsq.nii.ac.jp/records/12981
https://ipsj.ixsq.nii.ac.jp/records/12981fc30b11e-7860-45b9-86c6-c4f66e2d56f8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-08-15 | |||||||
タイトル | ||||||||
タイトル | 複合語マッチングと共起情報を併用する情報検索 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Information Retrieval Based on Combination of Japanese Compound Words Matching and Co - occurrence Based Retrieval | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語処理 | |||||||
著者所属 | ||||||||
横浜国立大学工学部 | ||||||||
著者所属 | ||||||||
横浜国立大学工学部 | ||||||||
著者所属 | ||||||||
横浜国立大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Yokohama National University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Yokohama National University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Yokohama National University | ||||||||
著者名 |
山田, 剛一
× 山田, 剛一
|
|||||||
著者名(英) |
Koichi, Yamada
× Koichi, Yamada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 情報検索においては,検索対象の規模が拡大するにつれ,検索精度の向上がより強く求められてきている.そこで本論文では,複合語をまとまりとして扱う手法と,単語の共起情報を用いる手法を統合することにより,検索システムの精度向上を図ることを提案する.複合語は全体で1つの概念を表現しており,まとまりとして扱うことが望ましいが,複合語どうしをマッチさせる場合には部分的なマッチングを考慮する必要が生じる.このマッチングを行い文書をスコア付けする手法を考案した.さらに,単語が複合語を構成せずに共起する場合もスコアに反映させるため,共起情報を利用する手法と組み合わせ,評価実験を行ったところ,単語の重みに基づく手法,およびそれに共起情報を加える手法のいずれよりも良い検索精度が得られることが確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To improve retrieval efficiency in information retrieval of Japanese documents,it is necessary to use the information about the structure of compound words because,in Japanese,they are frequently used and describe a concept as a whole.It is also necessary to use the information of co-occurrence of words because the compound word in a query might appear independently in a document.In this paper,we propose a new ranking method,which is combination of two methods.Namely,the method using information of co-occurrence,and the method using information of making compound of words.We evaluate the proposed method by the public test collections.Our experimental result shows that the method we proposedimproves both recall and precision as compared with the traditional vector space model based on tf.idf method,and also improves them as compared with the method which use information only about co-occurrence of words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 39, 号 8, p. 2431-2439, 発行日 1998-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |