@techreport{oai:ipsj.ixsq.nii.ac.jp:00225090, author = {渡邊, 健太 and 市原, 大裕 and 杉谷, 賢一 and 中野, 裕司 and 久保田, 真一郎 and Kenta, Watanabe and Daisuke, Ichihara and Kenichi, Sugitani and Hiroshi, Nakano and Shinichiro, Kubota}, issue = {4}, month = {Mar}, note = {本研究は大学で不登校になりそうな学生の学習ログから抽出されるアクセス回数などの特徴量を使用して予測を目的としている.前回の研究では Recall が 0.9 を超えていたが,Precision が 0.3 程度と偽陽性が多くなってしまった.今回は偽陽性を減らすため,特徴の違う 2 種類のデータを作成して陽性と判定された学生に複数回の予測を行った.データにはオンデマンド形式の授業である情報基礎を受講している学生を対象に,全授業のオンラインでのアクセスログと情報基礎の出席データを使用した.また,不登校傾向の学生を,情報基礎を 3 週以上連続で欠席した学生と定義した.そして,前回の研究で抽出した特徴量を使用して,1 週間ごとにランダムフォレストで複数回予測を行なった.データの作成には不均衡データに対する手法であるアンダーサンプリングをしたデータとさらにクラスタ分類を行なって抽出したデータを作成した.そして,作成したモデルでアンサンブル学習を行なった., The purpose of this study is to predict students who are likely to be truant at university using features such as the number of accesses extracted from their learning logs. In the previous study, Recall exceeded 0.9, but Precision was about 0.3, resulting in many false positives. In order to reduce the number of false positives, we created two types of data with different characteristics and made multiple predictions for students who tested positive. Online access logs for all classes and attendance data for Basic Information were used for students taking Basic Information, an on-demand course. Students who tended to be absent from school were defined as those who were absent from Basic Information for more than three consecutive weeks. We then used the features extracted in the previous study to make multiple predictions in a random forest per week. The data were generated by under-sampling, a method used for imbalanced data, and by cluster classification. Ensemble learning was performed on the created models.}, title = {連続欠席者の予測を目的とした予測方法とデータの作成}, year = {2023} }