WEKO3
アイテム
検索隠し味を用いた専門検索エンジンの構築
https://ipsj.ixsq.nii.ac.jp/records/11601
https://ipsj.ixsq.nii.ac.jp/records/11601ffb30c70-5d79-4919-992c-4f5b4855432a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-06-15 | |||||||
タイトル | ||||||||
タイトル | 検索隠し味を用いた専門検索エンジンの構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Keyword Spice Method for Building Domain-specific Web Search Engines | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 知能処理 | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科社会情報学専攻/現在,NTTドコモ | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科社会情報学専攻 | ||||||||
著者所属 | ||||||||
イメージ情報科学研究所/現在,三洋電機株式会社 | ||||||||
著者所属 | ||||||||
大阪市立大学大学院工学研究科情報工学専攻 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科社会情報学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics, Graduate School of Informatics, Kyoto University/Presently with NTT DoCoMo, Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics, Graduate School of Informatics, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Laboratories of Image Information Science and Technology/Presently with SANYO Electric Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Communication Engineering, Graduate School of Engineering, Osaka City University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics, Graduate School of Informatics, Kyoto University | ||||||||
著者名 |
小久保, 卓
× 小久保, 卓
|
|||||||
著者名(英) |
Takashi, Kokubo
× Takashi, Kokubo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | いまやインターネットは現代社会の中に急速に浸透しており,そのサービスの中でも特にWWW(World Wide Web)は新しいメディアとしてその情報量を増大させている.しかしながら最も一般的なWWW情報検索手法である検索エンジンは,必要な情報を得るためにある程度の知識や経験が必要とされ,多くの初心者にとって使いこなすのは容易ではない.こうしたWWW情報検索における問題の解決法の1つとして,ドメインを限定した専門検索エンジンの提供があげられている.そこで本論文では専門検索エンジンを構築するための新しい手法として``検索隠し味''を用いた手法を提案する.これはユーザの入力クエリに対しある特定のキーワードを追加すると,汎用検索エンジンの出力のほとんどがドメインに関係するWebページとなるという経験則を利用したものである.そして機械学習の一種である決定木学習アルゴリズムを元にWebページ集合からキーワードのブール式の選言標準形として検索隠し味を抽出するアルゴリズムを開発した.さらに本手法を料理レシピ検索に適用し評価実験を行うことで,その有効性の確認を行った. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The WWW technology has come into wide use in our society as an infrastructure that supports our daily life. But gathering information from the WWW is a difficult task for a novice user even if he uses the search engines that are most widely used tool to retrieve information from the WWW. Because the user must have experience and skill to find the relevant pages from the large number of documents returned, which often cover a wide variety of topics. One solution to the problem is to build a domain-specific search engine. So this paper presents a new method that improves search performance by adding the domain-specific keywords, called keyword spices, to the user's input query; the modified query is then forwarded to a general-purpose search engine. We describe a machine learning algorithm, which is a type of decision-tree learning algorithm, that can extract keyword spices as a disjunctive normal form of keywords from Web documents. To demonstrate the value of the keyword spices, we conducted experiments in the cooking domain and the results showed the high performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 43, 号 6, p. 1804-1813, 発行日 2002-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |