WEKO3
アイテム
模倣コンテンツの特性に基づくフィッシング検知方式の誤検知防止
https://ipsj.ixsq.nii.ac.jp/records/66459
https://ipsj.ixsq.nii.ac.jp/records/66459f1989200-0e29-46ad-b61a-b319196fc72e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-09-15 | |||||||
タイトル | ||||||||
タイトル | 模倣コンテンツの特性に基づくフィッシング検知方式の誤検知防止 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Preventing False Positives in Phishing Detection Based on Features of Mimic Content | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:社会を活性化するコンピュータセキュリティ技術 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
電気通信大学大学院電気通信学研究科人間コミュニケーション学専攻 | ||||||||
著者所属 | ||||||||
電気通信大学電気通信学部人間コミュニケーション学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Department of Human Communication, The Graduate School of Electro-Communications, The University of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
The Department of Human Communication, The Faculty of Electro-Communications, The University of Electro-Communications | ||||||||
著者名 |
中山, 心太
× 中山, 心太
|
|||||||
著者名(英) |
Shinta, Nakayama
× Shinta, Nakayama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | コンテンツベースのフィッシング検知方式では,検査対象ページから自然言語処理技術を利用してキーワードを抽出し,そのキーワードを用いてインターネット検索することで,正規サイト候補を得る.そして,検査対象ページと正規サイト候補のドメインと比較することで,検査対象ページの真偽を判定する.しかし,キーワード抽出の精度が不十分なため,検査対象が正規であっても,フィッシングと誤検知することが多い.そこで本論文では,検査対象ページだけでなく周辺ページを含んだ解析をすることで,より広域のキーワードを抽出するドメインキーワード手法と,閲覧サイトの過去のページを参照することで時間的に安定なキーワードを抽出する時間不変キーワード手法を提案し,実装した.正規サイト172件を用いた評価実験では,従来手法では誤検知率が14.0%だったが,提案手法により7.6%に改善された.フィッシングサイト172件を用いた評価実験では,従来手法では2.9%が誤検知したが,提案手法による誤検知率の増加はなかった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Content-based phishing detection extracts keywords from the target Web page, uses these keywords to retrieve the corresponding legal site, and detects phishing when the domain of the target page does not match that of the retrieved site. It often judges a legal target page as phishing, however, because the extracted keywords are not adequate. This paper describes two methods of extracting keywords: domain keyword extraction that extracts keywords from not only target page but also other pages linked from the target and time-invariant keyword extraction that extracts keyword from the intersection between the target and its past data. Experimentation using 172 legal pages has shown the decrease of false detection from 14.0% to 7.6% and that using 172 phishing pages has shown that the ratio of overlooking phishing does not have changed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 50, 号 9, p. 2034-2047, 発行日 2009-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |