@techreport{oai:ipsj.ixsq.nii.ac.jp:00040314,
 author = {福重, 貴雄 and 菅野祐司 and Yoshio, Fukushige and Yuji, Kanno},
 issue = {51(2003-FI-071)},
 month = {May},
 note = {文書ベクトルのような高次元データをベイジアンネットワークを用いて分類するには、有効素性の選択による次元削減や適切な離散化が必須の課題となる。筆者らは、単語文書空間における対応分析とMDL規準に基づいた離散化をベイジアンネットワークに組み合わせて用いることによって、上記の問題の解決を図った。上記方式を二つのベイジアンネットnaive Bayes型とTAN型と組み合わせて、RWCテキストコーパスを対象として評価実験を行い、F値で平均8%(最大18%)の分類能力の向上を確認した。, In utilizing Bayesian networks as a categorizer, it is often problematic when the data to be categorized are represented in a vector form with very high dimension, like document vectors in a vector space model.  In this paper, we address this issue by reducing the dimensionality with correspondence analysis (CA) and an MDLP-based discretization, and using the resultant data as the input to a Bayesian network leaner. In our empirical validation with the RWC corpus, this method compares favorably with the conventional results on the same data, showing 8% improvement of F-measure on average (max. 18%)},
 title = {対応分析とベイジアンネットワークを用いた文書分類},
 year = {2003}
}