WEKO3
アイテム
知識ベースを用いた人名検索時の曖昧性の解消
https://ipsj.ixsq.nii.ac.jp/records/18907
https://ipsj.ixsq.nii.ac.jp/records/18907ac002536-1cee-411d-a154-890ce7f6b4ee
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-07-13 | |||||||
タイトル | ||||||||
タイトル | 知識ベースを用いた人名検索時の曖昧性の解消 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Name Disambiguation in Web Search Using Knowledge Base | |||||||
言語 | ||||||||
言語 | eng | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学情報理工学系研究科 | ||||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者名 |
VuQuangMinh
正田備也
高須, 淳宏
安達, 淳
× VuQuangMinh 正田備也 高須, 淳宏 安達, 淳
|
|||||||
著者名(英) |
Quang, MINHVU
Tomonari, MASADA
Atsuhiro, TAKASU
Jun, ADACHI
× Quang, MINHVU Tomonari, MASADA Atsuhiro, TAKASU Jun, ADACHI
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 人名で検索するとき,同姓同名のため,検索結果に複数の人に関する文書が含まれることが通例である.検索結果をそれぞれの人に関する文書クラスタに分ける手法について検討した.文書間の類似度を計り,同じ人に関する文書かどうかを推測する必要があるが,先行研究では,ベクトル空間モデル法や固有名詞抽出法に基づいて文書間の類似度を計っている.我々は知識ベースを用いて,文書間の共通コンテキストを見つけて,共通コンテキストの重みを計り,文書間の類似度を測定する手法を提案する.実験により,我々の提案手法が先行手法より優れていると確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Results of queries by personal names often contain documents related to several people because of namesake problem. In order to discriminate documents related to different people, it is required an effective method to measure document similarities and to find out relevant documents of the same person. Some previous researches have used cosine similarity method or have tried to extract common named entities for measuring similarities. We propose a new method which uses web directories as knowledge base to find out shared contexts in document pairs and uses the measurement of shared contexts as similarities between document pairs. Experimental results show that our proposed method outperforms cosine similarity method and common named entities method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2006, 号 78(2006-DBS-140), p. 185-192, 発行日 2006-07-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |