@techreport{oai:ipsj.ixsq.nii.ac.jp:00106805,
 author = {福元伸也 and 渕田孝康},
 issue = {28},
 month = {Nov},
 note = {近年，ビッグデータと呼ばれる大規模データから有益な情報を抽出しようとする試みが広く行われており，テキストデータの解析に関する多くの研究がなされている．本研究では，シソーラスの分類語彙表を用いて，単語の特徴ベクトルである共起行列を生成する手法を提案する．出現単語のみによる共起行列を，単語の意味を考慮した分類語に変換することにより，共起行列の次元数が増大するのを抑えることができ，単語の特徴ベクトルをより的確なベクトルとして表現できる．また，得られた共起行列から分類を行うための学習器には，アンサンブル学習の 1 つであるランダムフォレストと大規模データに対して高度な分析が可能な機械学習フレームワークである Jubatus を用いた．実験では，ニュース記事のカテゴリ分類を行い，複数の学習アルゴリズムについて検証した．},
 title = {単語の共起関係に基づく機械学習による文書分類},
 year = {2014}
}