WEKO3
アイテム
LSIの適用による大規模HTTPアクセスログからの情報抽出
https://ipsj.ixsq.nii.ac.jp/records/40628
https://ipsj.ixsq.nii.ac.jp/records/40628db470772-2128-437c-bd57-b626af9b7594
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-05-14 | |||||||
タイトル | ||||||||
タイトル | LSIの適用による大規模HTTPアクセスログからの情報抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extracting Information from Large HTTP Logfiles using LSI | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
学術情報センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Center for Science Information Systems | ||||||||
著者名 |
相澤, 彰子
× 相澤, 彰子
|
|||||||
著者名(英) |
Akiko, Aizawa
× Akiko, Aizawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文献検索の分野で近年利用されている自動索引づけ手法LSI (Latent Semantic Indexing)を大規模HTTPログに適用して,ホストドメイン間の類似度を求める手法を検討する.特に膨大なログデータを扱うために,URL階層上でカルバック情報量を尺度としたデータの要約を試み,その効果を実際のログデータを用いて検証する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper adopts LSI(Latent Semantic Indexing), an automatic indexing technique recently used in information retrieval, to large-scale HTTP logs and estimates the similarity between two Internet domains. In order to manipulate the huge amount, of data, Kullback-Leibler information criteria is applied in the pre-processing stage to summarize the URL hierarchy. The effect of the summarization is demonstrated using actual HTTP log data. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 1998, 号 34(1998-FI-049), p. 33-40, 発行日 1998-05-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |