ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. データベース(TOD)[電子情報通信学会データ工学研究専門委員会共同編集]
  3. Vol.1
  4. No.2

カテゴリ型レコードデータからの属性値間の相関性を利用した外れ値検出手法

https://ipsj.ixsq.nii.ac.jp/records/17385
https://ipsj.ixsq.nii.ac.jp/records/17385
16ebac3a-bdf3-4b69-96c6-ef7bf2ac04a8
名前 / ファイル ライセンス アクション
IPSJ-TOD0102005.pdf IPSJ-TOD0102005.pdf (1.1 MB)
Copyright (c) 2008 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2008-09-30
タイトル
タイトル カテゴリ型レコードデータからの属性値間の相関性を利用した外れ値検出手法
タイトル
言語 en
タイトル Outlier Detection for Categorical Record Data Considering Associations between Attribute Values
言語
言語 jpn
キーワード
主題Scheme Other
主題 研究論文
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
筑波大学大学院システム情報工学研究科
著者所属
筑波大学大学院システム情報工学研究科/筑波大学計算科学センター
著者所属(英)
en
Graduate School of Systems and Information Engineering, University of Tsukuba
著者所属(英)
en
Graduate School of Systems and Information Engineering, University of Tsukuba / Center for Computational Sciences, University of Tsukuba
著者名 成田, 和世 北川, 博之

× 成田, 和世 北川, 博之

成田, 和世
北川, 博之

Search repository
著者名(英) Kazuyo, Narita Hiroyuki, Kitagawa

× Kazuyo, Narita Hiroyuki, Kitagawa

en Kazuyo, Narita
Hiroyuki, Kitagawa

Search repository
論文抄録
内容記述タイプ Other
内容記述 巨大なデータから珍しいイベントや逸脱したオブジェクト,例外等を発見する技術である外れ値検出は,幅広い応用範囲を持つことから,近年ますます注目されている.しかし,既存の外れ値検出手法は連続値を属性値に持つ数値型レコードデータを対象とするものが多い.このような既存外れ値検出手法を用いてカテゴリ型の値を属性値に持つカテゴリ型レコードデータから外れ値を検出することは困難である.そこで,本稿ではこのようなカテゴリ型レコードデータから外れ値となるレコードを検出するためのフレームワークを提案する.我々は,あるレコード内に存在する属性値の集合と本来ならば共起するはずの属性値が,そのレコード内で数多く観測されない場合に,そのレコードを外れ値と見なすこととしている.本稿ではまず,属性間の相関性を表すものとして相関ルールを利用し,外れ値度の式を導入する.また,より高速に外れ値レコードを検出するための効率的アルゴリズムを提示する.実データを用いた実験では,提案手法が関連手法と比較して十分な検出精度を得られること,ナイーブアルゴリズムに比べて提案アルゴリズムの処理速度が数十倍向上することを示す.さらに,提案手法が外れ値として価値のあるレコードを本当に検出できるかどうかを確認するため,実データから外れ値検出を行い,外れ値として得られたレコードの希少性を検証する.
論文抄録(英)
内容記述タイプ Other
内容記述 Outlier detection, a data mining technique to detect rare events, deviant objects, and exceptions from data, has been drawing increasing attention in recent years. Most existing outlier detection algorithms focus on numerical data sets. It is difficult for such approaches to detect outliers from categorical record databases in which attribute values are categorical. We target categorical record databases and detect records in which many attribute values are not observed even though they should occur in association with other attribute values in the records. To detect such records as outliers, we provide an outlier degree utilizing association rules as associations between attribute values. We also propose an efficient algorithm for detecting such outlier records. Experiments using real data sets show that the proposed method can derive sufficient detection accuracies compared to related works, and that the proposed algorithm runs faster than the brute force algorithm does. Moreover, we introduce interesting records which have been practically detected as outliers from real data sets.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11464847
書誌情報 情報処理学会論文誌データベース(TOD)

巻 1, 号 2, p. 38-53, 発行日 2008-09-30
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7799
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 23:22:04.273207
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3