WEKO3
アイテム
一般化されたノイズ入りデータに対する相関ルールマイニング
https://ipsj.ixsq.nii.ac.jp/records/18933
https://ipsj.ixsq.nii.ac.jp/records/18933e00c2e0d-b2e5-40ed-a0de-59072123ab1b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-07-14 | |||||||
タイトル | ||||||||
タイトル | 一般化されたノイズ入りデータに対する相関ルールマイニング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Association Rule Mining for a Generalized Noisy Data Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering,University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering,University of Tsukuba | ||||||||
著者名 |
成田, 和世
× 成田, 和世
|
|||||||
著者名(英) |
Kazuyo, NARITA
× Kazuyo, NARITA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 情報技術の発達に伴い,ディジタル情報は増加,多様化の一途を辿っている.それに伴い,巨大なデータから隠れた特徴や規則を体系的に発見するデータマイニングの技術は,ますます重要となっている.しかし,実世界に存在するデータは欠損値や誤った値などのノイズを含むものも多い.このようなノイズ入りデータからマイニングされる情報は不正確なものとなってしまう.先行研究[1] で,我々はあるトランザクションに本来出現するはずのアイテムがそのトランザクションから消失するノイズと,本来出現しないはずのアイテムがそのトランザクションに出現するノイズの,2 種類のノイズを想定して,この2 種類のノイズのみを含むデータベースから,ノイズのない真の状態のデータベースにおける頻出アイテム集合を推定する手法を提案した.しかし,実世界上のデータには,[1] が想定した2 種類のノイズ以外のノイズを持つものも多く存在する.本稿では,[1] で提案した頻出アイテム集合の推定法を,より一般的なノイズ入りデータに対しても使用できるように一般化する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As we face huge amounts of varied information, data mining, which helps us discover hidden features or rules from voluminous data systematically, has become more important. However, many data in real world are dirty, including noises such as missing values or irrelevant values. The information mined from such noisy data becomes incorrect. In our previous work [1], we assumed a noisy data model which involves two kinds of noise: one is that an item which should be in a transaction erronously disappears, and another that an item which should not be in a transaction erronously appears. We proposed the method to estimate frequent itemsets [2] on the noiseless data, by probabilistic calculation using the noisy one. However, the real world data may include more complex patterns of noises. In this paper, we present a more generalized noisy data model, and discuss association rule mining under the model. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2006, 号 78(2006-DBS-140), p. 383-390, 発行日 2006-07-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |