@techreport{oai:ipsj.ixsq.nii.ac.jp:00106805,
 author = {福元伸也 and 渕田孝康},
 issue = {28},
 month = {Nov},
 note = {近年,ビッグデータと呼ばれる大規模データから有益な情報を抽出しようとする試みが広く行われており,テキストデータの解析に関する多くの研究がなされている.本研究では,シソーラスの分類語彙表を用いて,単語の特徴ベクトルである共起行列を生成する手法を提案する.出現単語のみによる共起行列を,単語の意味を考慮した分類語に変換することにより,共起行列の次元数が増大するのを抑えることができ,単語の特徴ベクトルをより的確なベクトルとして表現できる.また,得られた共起行列から分類を行うための学習器には,アンサンブル学習の 1 つであるランダムフォレストと大規模データに対して高度な分析が可能な機械学習フレームワークである Jubatus を用いた.実験では,ニュース記事のカテゴリ分類を行い,複数の学習アルゴリズムについて検証した.},
 title = {単語の共起関係に基づく機械学習による文書分類},
 year = {2014}
}