WEKO3
アイテム
Geocrawler:個人サイトの評価情報と位置情報に基づいた店舗検索用Web インデクサの開発
https://ipsj.ixsq.nii.ac.jp/records/9903
https://ipsj.ixsq.nii.ac.jp/records/990329222039-31de-4113-8297-a1e75d27d7ac
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-07-15 | |||||||
タイトル | ||||||||
タイトル | Geocrawler:個人サイトの評価情報と位置情報に基づいた店舗検索用Web インデクサの開発 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Geocrawler: Web Indexer for Store Search based on Geographical Information and Evaluation Information on Personal Web Sites | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:マルチメディア,分散,協調とモバイル(DICOMO2006) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | ネットワークサービス | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
新井, イスマイル
× 新井, イスマイル
|
|||||||
著者名(英) |
Ismail, Arai
× Ismail, Arai
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,口コミ情報サイトを例とする,ユーザの行動を基にした店舗・施設の検索サイトが注目されている.これらの検索サイトでは,位置に基づいた検索が可能であることと,店舗・施設に対して複数のユーザからの第3 者の評価情報が取得できることが求められている.しかし,商用の検索サイトには広告収入や検閲の影響により,被評価店舗にとって不都合な情報が現れにくく第3 者の評価情報の提供に問題がある.また,従来の情報取得手法ではWWW 上の情報をすべて収集し,複雑な自然言語処理によって位置に基づいた評価情報を抽出する作業が必要となり,サービス構築コストが膨大となるという問題がある.そこで本研究では従来の全文型検索エンジンを活用し,目的の分野を示すキーワードと商用検索サイトを除外するキーワードを組み合わせることによって目的の第3 者の評価情報を収集する手法と,単純な形態素解析と文字列のパターンマッチングを用いた文字列処理によって住所を抽出する手法を提案する.この手法に基づいてWeb インデクサを評価した結果,一度の収集のうち44%が目的とする個人サイトであり,位置情報の取得再現率が59%という結果が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A user expects that he/she can search stores and facilities from Web information space based on his/her behavior (Ex. Word-of-mouth communication sites). For this purpose, an appropriate information must be retrieved based on user’s location. In addition, a user expect that he/she can retrieve actual impressions of other users against stores and facilities to decide his/her behavior. However, there are two major problems to achieve the above requirements. One is that the actual impression of other users are often omitted on the commercial web sites by the sponsor’s claims. The other is that the cost for the information retrieval may become large because the existing search engines have to crawl most of Web sites and the complicated natural language processing have to be used. In this paper, we propose a new method which can obtain appropriate Web contents from Web search engines by inputting keywords that include user’s objective information and black list information. In addition, the proposed method can extract the geographical information from the obtained Web contents by a morphological analysis and a simple pattern matching. As a result of evaluating the Web indexer based on the proposed method, 44% in all obtained Web contents conforms to user’s objective. Also, the recall ratio of the extract of the geographical information is 59%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 48, 号 7, p. 2319-2327, 発行日 2007-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |