WEKO3
-
RootNode
アイテム
クエリの語句の重要度と係り受けを考慮した自然文検索
https://ipsj.ixsq.nii.ac.jp/records/61117
https://ipsj.ixsq.nii.ac.jp/records/6111792d83511-56da-4482-88a7-807e2cc7de2f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-15 | |||||||
タイトル | ||||||||
タイトル | クエリの語句の重要度と係り受けを考慮した自然文検索 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Natural Language Search Based on Term Importance and Dependency Relations | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者名 |
新里, 圭司
黒橋, 禎夫
× 新里, 圭司 黒橋, 禎夫
|
|||||||
著者名(英) |
Keiji, Shinzato
Sadao, Kurohashi
× Keiji, Shinzato Sadao, Kurohashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では自然言語で表現されたクエリに含まれる単語,係り受け関係を,重要度に応じて使い分けて文書検索を行う方法を提案する.重要度としては,(1) 検索結果中の文書に必ず含まれなければならない(必須),(2) 含まれている方が好ましい (任意),(3) 含まれていなくても良い(不要) の3 段階を設け,単語,係り受け関係をいずれかに分類する.提案手法を NTCIR-3,4 で構築されたテストセットを利用して評価した結果,固有表現および一部の複合名詞内の係り受け関係については,「必須」 として扱うことで検索性能が改善されることがわかった.また,名詞から意味が推測される動詞を「任意」として扱うことで,全動詞を検索に用いたり,削除したりする方法よりも高い性能が達成できることがわかった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes the method that retrieves documents by switching words and dependency relations in a natural language query according to their importance. We defined three levels as term importance. The first is "required", terms that must be in retrieved documents. The second is "optional", terms that are preferable to be included in the documents. The third is "unnecessary", terms that are not matter whether they are included in the documents. Words and dependency relations in a query are classified into any one of these levels. We evaluated the contribution of our approach using the NTCIR-3 and NTCIR-4 test collections. As a result, the search performance was improved by regarding dapendency relations in named entities and some compound nouns as the required terms. The performance was also improved by regarding verbs whose meaning is inferred from nouns as optional terms. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報学基礎(FI) 巻 2009, 号 2(2009-FI-93), p. 113-120, 発行日 2009-01-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |