WEKO3
アイテム
大域ウェブアクセスログを用いた関連語の発見法に関する一考察
https://ipsj.ixsq.nii.ac.jp/records/17514
https://ipsj.ixsq.nii.ac.jp/records/175146718f369-d6cc-440b-b908-690434b45fe8
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2005-06-15 | |||||||
| タイトル | ||||||||
| タイトル | 大域ウェブアクセスログを用いた関連語の発見法に関する一考察 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | A Study for Related Words Finding Method Using Global Web Access Logs | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 研究論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 東京大学生産技術研究所 | ||||||||
| 著者所属 | ||||||||
| 東京大学生産技術研究所 | ||||||||
| 著者所属 | ||||||||
| 東京大学生産技術研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Institute of Industrial Science The University of Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Institute of Industrial Science The University of Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Institute of Industrial Science The University of Tokyo | ||||||||
| 著者名 |
大塚真吾
豊田, 正史
喜連川, 優
× 大塚真吾 豊田, 正史 喜連川, 優
|
|||||||
| 著者名(英) |
Shingo, Otsuka
Masashi, Toyoda
Masaru, Kitsuregawa
× Shingo, Otsuka Masashi, Toyoda Masaru, Kitsuregawa
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | サイバー空間上では多くの人々が自分の欲しい情報を探すために検索エンジンを利用している.検索技術の進歩により検索精度は向上し,自分が調べたい事柄を検索語として入力するだけで様々な情報を得ることが可能となった.しかし,ユーザがいつでも検索目的に適した検索語を思い付くとは限らない.本論文ではテレビ視聴率調査と同様,統計的に偏りなく抽出された日本人(パネル)を対象にURL 履歴の収集を行う大域ウェブアクセスログ(パネルログ)を用いて,与えられた検索語と関連する検索語(関連語)を発見する方法について検討を行う.先行研究ではユーザが検索語を入力した後に閲覧されたURL の集合を特徴空間として関連語の抽出を行っているが,我々は検索語を入力した後に訪れたウェブコミュニティ(類似したウェブページの集まり)とウェブページに対する形態素解析処理により得られた名詞の集合を特徴空間に利用する手法を提案する.実験結果から提案手法は特徴空間にURL を用いる手法よりも多くの関連語を抽出し,また,特徴空間に名詞を用いる手法とコミュニティを用いる手法では,抽出する関連語の性質が異なる傾向があることを示す. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Web search engines are playing more and more important role for information retrieval in the cyberspace. Due to the improvement of searching accuracy with development of technologies, it the becomes possible that users can get kinds of information by just inputting keyword(s) representing the topic which users are interested in. But it is not always true that users can hit upon keyword(s) properly. In this paper, by using Web access logs (called panel logs), which are collected URL histories of Japanese users (called panels) selected without static deviation similar to the survey on TV audience rating, we study the methods of finding the related keywords associated with the keywords inputted by users. Different from the existing systems where the related keywords are extracted based on the set of URLs visited by the users after inputting their original keyword(s), we propose two methods to extract the related keywords. One is based on the Web communities (set of similar web pages); the other is based on the set of nouns obtained by morphological analysis of Web pages. According to evaluation results, the proposed methods can extract more related keywords than that based on URL. The results also show that the method based on the Web communities and the method based on nouns have different characters while extracting the related keywords. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11464847 | |||||||
| 書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 46, 号 SIG8(TOD26), p. 82-92, 発行日 2005-06-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7799 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||