@article{oai:ipsj.ixsq.nii.ac.jp:00017452, author = {濱本, 雅史 and 北川, 博之 and Masafumi, Hamamoto and Hiroyuki, Kitagawa}, issue = {SIG19(TOD32)}, journal = {情報処理学会論文誌データベース(TOD)}, month = {Dec}, note = {数値属性を持つデータから得られる線形関係は,欠損値の補完,予測,外れ値検出など多数の応用が可能であり,その抽出は重要な技術課題である.本論文では線形関係を表した比率規則の抽出手法として,相関ルールマイニングで用いられるサポートと確信度の概念を取り入れた手法を提案する.線形回帰および既存の比率規則抽出手法では,線形関係を直線や超平面として表すため,表現可能な線形関係に制限があり,また同一のデータより得られる結果はユーザの興味によらず一定である.本論文では線分とその周辺領域内のデータが満たす性質として比率規則を定式化し,この定義をもとにサポートと確信度の概念を導入することで既存の手法の問題を解決する.提案手法はユーザより与えられた最小サポートと最小確信度を満たし,かつサポートまたは確信度を最大とする比率規則をタプル数に対し線形時間で抽出する.この提案手法の拡張としてクラスタリングと組み合わせることで,局所性を持った比率規則を抽出する手法も加えて提案する.人工データと実データを用いた実験で,提案手法がユーザの意向に応じた結果を出力することを示す., Extracting linear relationships among numeric attributes is an important problem because it is applicable to filling in missing attribute values, forecasting values, detecting outliners, and related issues. This paper proposes a method to extract Ratio Rules, which represent linear relationships among numeric attributes, with support and confidence factors in analogy to association rule mining. Linear regression and existing Ratio Rule mining techniques are concerned with linear relationship extraction. However, their expressive power is limited since they represent a linear relationship as a line or a hyperplane. Moreover, they are not able to reflect the user's intention. In this paper we formulate a Ratio Rule as a line segment and its neighborhood, and then solve problems in existing methods by introducing support and confidence concepts. Our proposed method extracts Ratio Rules maximizing support or confidence, which satisfy the minimum support and confidence given by the user, in linear time for the number of tuples. We also propose a method to extract Local Ratio Rules, which hold in local areas, by combining with a clustering method. Experimental results for synthetic and real data show our proposed method works well.}, pages = {54--71}, title = {サポートと確信度をもとにした比率規則による線形関係抽出}, volume = {47}, year = {2006} }