ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング


インデックスリンク

インデックスツリー

  • RootNode

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. データベースシステム(DBS)※2025年度よりデータベースとデータサイエンス(DBS)研究会に名称変更
  3. 2009
  4. 2009-DBS-149

スプログ検出におけるHTML構造の類似性の有効性の評価

https://ipsj.ixsq.nii.ac.jp/records/66699
https://ipsj.ixsq.nii.ac.jp/records/66699
1ad6f6cc-4160-4207-abcf-577c5a077898
名前 / ファイル ライセンス アクション
IPSJ-DBS09149019.pdf IPSJ-DBS09149019.pdf (868.2 kB)
Copyright (c) 2009 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2009-11-13
タイトル
タイトル スプログ検出におけるHTML構造の類似性の有効性の評価
タイトル
言語 en
タイトル Evaluating Effects of Similarities of HTML Structures in Splog Detection
言語
言語 jpn
キーワード
主題Scheme Other
主題 セッション:ブログ
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
筑波大学大学院システム情報工学研究科
著者所属
東京電機大学大学院工学研究科
著者所属
筑波大学大学院システム情報工学研究科
著者所属
(株) ナビックス
著者所属
東京大学人工物工学研究センター
著者所属(英)
en
Graduate School of Systems and Information Engineering, University of Tsukuba
著者所属(英)
en
Graduate School of Engineering, Tokyo Denki University
著者所属(英)
en
Graduate School of Systems and Information Engineering, University of Tsukuba
著者所属(英)
en
Navix Co., Ltd.
著者所属(英)
en
Research into Artifacts, Center for Engineering, University of Tokyo
著者名 片山, 太一 芳中, 隆幸 宇津呂, 武仁 河田, 容英 福原, 知宏

× 片山, 太一 芳中, 隆幸 宇津呂, 武仁 河田, 容英 福原, 知宏

片山, 太一
芳中, 隆幸
宇津呂, 武仁
河田, 容英
福原, 知宏

Search repository
著者名(英) Taichi, Katayama Takayuki, Yoshinaka Takehito, Utsuro Yasuhide, Kawada Tomohiro, Fukuhara

× Taichi, Katayama Takayuki, Yoshinaka Takehito, Utsuro Yasuhide, Kawada Tomohiro, Fukuhara

en Taichi, Katayama
Takayuki, Yoshinaka
Takehito, Utsuro
Yasuhide, Kawada
Tomohiro, Fukuhara

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では,ブログにおいてアフィリエイト収入を得ることを目的とするスパム (スパムブログ,スプログ) のうち,特に,同一のスパムブログ作成者が自動的に大量生成したと推測されるスプログの検出において,HTML 構造の類似性が効果的であることを示す.具体的には,ブログの HTML ファイルにおける DOM ツリーから,コンテンツの最小単位に相当するブロックを抽出し,複数のスプログの間でブロック構造の類似性を測定する.その結果,同一ブログホストにおけるスプログのうち,同一のスパムブログ作成者が自動的に大量生成したと推測されるスプログ同士では,ブロック構造が類似する傾向があることを示す.また,ブロック構造の類似性を素性として用いることにより,SVM によるスプログ検出の性能が向上する場合があることを示す.
論文抄録(英)
内容記述タイプ Other
内容記述 Spam blogs or splogs are blogs hosting spam posts, created using machine generated or hijacked content for the sole purpose of hosting advertisements or raising the number of inward of target sites. Among those splogs, this paper focuses on detecting a group of splogs which are estimated to be created by an identical spammer. We especially show that similarities of html structures among those splogs created by an identical spammer contribute to improving the performance of splog detection. In measuring similarities of html structures, we extract a list of blocks (minimum unit of content) from the DOM tree of a html file. We show that the html files of splogs estimated to be created by an identical spammer tend to have similar DOM trees and this tendency is quite effective in splog detection.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10112482
書誌情報 研究報告データベースシステム(DBS)

巻 2009-DBS-149, 号 19, p. 1-8, 発行日 2009-11-13
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 00:55:06.987570
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3