WEKO3
アイテム
ベイジアンフィルタリングを用いた迷惑メール対策における多言語環境でのコーパス分離手法の提案と評価
https://ipsj.ixsq.nii.ac.jp/records/10556
https://ipsj.ixsq.nii.ac.jp/records/10556fb384174-6bd9-4732-ae75-ae3ce7466e76
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-08-15 | |||||||
タイトル | ||||||||
タイトル | ベイジアンフィルタリングを用いた迷惑メール対策における多言語環境でのコーパス分離手法の提案と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Proposal and Evaluation for Improvement of Corpus Separation in Bayesian Spam Filtering on Multi-lingual Environment | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:多様な社会的責任を担うコンピュータセキュリティ技術 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | ネットワークセキュリティ | |||||||
著者所属 | ||||||||
九州大学大学院システム情報科学府,現在,三菱電機情報ネットワーク株式会社 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院,現在,岡山大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering, Kyushu University,Presently with Mitsubishi Electric Information Network Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Science and Electrical Engineering, Kyushu University,Presently with Graduate School of Natural Science and Technology, Okayama University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者名 |
岩永, 学
× 岩永, 学
|
|||||||
著者名(英) |
Manabu, Iwanaga
× Manabu, Iwanaga
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 迷惑メールに対する,ベイズ理論を用いた統計的なフィルタリング(いわゆるベイジアンフィルタリング)の研究は以前から行われていたが,2002年に発表されたGraham の「A plan for spam」1)をきっかけとしてベイジアンフィルタリングを用いた迷惑メールフィルタが多数開発されるようになった.統計的フィルタリングの場合,複数の言語の電子メールが混在する電子メール環境においては,従来,電子メールの言語ごとにコーパス(学習データ)を分けることが行われてきた.本論文では,日本語と英語のように複数の言語の電子メールが混在する電子メール環境における迷惑メールと正当な電子メールの分類精度向上を目的として,トークンごとに使用するコーパスを選択する方式を提案する.また,従来のメールごとにコーパスを選択する手法を実験により比較し,提案方式の有用性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Statistical filtering using Bayes theory, called Bayesian filtering, is studied for years, and after Graham published an essay “A plan for spam” 1), many implementations of Bayesian filtering have developed. In multi-lingual email environment, which more than one language is used in incoming email, corpus for statistical filtering is usually separated into ones specified to each language. In this paper, we propose a new method in which a corpus is chosen for each token, and then we show the efficiency of our proposed method by experiments in comparison to traditional methods. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 46, 号 8, p. 1959-1966, 発行日 2005-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |