Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-03 |
タイトル |
|
|
タイトル |
連続欠席者の予測を目的とした予測方法とデータの作成 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Forecasting methods and data for the purpose of predicting consecutive absent students |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
熊本大学 |
著者所属 |
|
|
|
熊本大学 |
著者所属 |
|
|
|
熊本大学 |
著者所属 |
|
|
|
熊本大学 |
著者所属 |
|
|
|
熊本大学 |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University |
著者所属(英) |
|
|
|
en |
|
|
Kumamoto University |
著者名 |
渡邊, 健太
市原, 大裕
杉谷, 賢一
中野, 裕司
久保田, 真一郎
|
著者名(英) |
Kenta, Watanabe
Daisuke, Ichihara
Kenichi, Sugitani
Hiroshi, Nakano
Shinichiro, Kubota
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究は大学で不登校になりそうな学生の学習ログから抽出されるアクセス回数などの特徴量を使用して予測を目的としている.前回の研究では Recall が 0.9 を超えていたが,Precision が 0.3 程度と偽陽性が多くなってしまった.今回は偽陽性を減らすため,特徴の違う 2 種類のデータを作成して陽性と判定された学生に複数回の予測を行った.データにはオンデマンド形式の授業である情報基礎を受講している学生を対象に,全授業のオンラインでのアクセスログと情報基礎の出席データを使用した.また,不登校傾向の学生を,情報基礎を 3 週以上連続で欠席した学生と定義した.そして,前回の研究で抽出した特徴量を使用して,1 週間ごとにランダムフォレストで複数回予測を行なった.データの作成には不均衡データに対する手法であるアンダーサンプリングをしたデータとさらにクラスタ分類を行なって抽出したデータを作成した.そして,作成したモデルでアンサンブル学習を行なった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The purpose of this study is to predict students who are likely to be truant at university using features such as the number of accesses extracted from their learning logs. In the previous study, Recall exceeded 0.9, but Precision was about 0.3, resulting in many false positives. In order to reduce the number of false positives, we created two types of data with different characteristics and made multiple predictions for students who tested positive. Online access logs for all classes and attendance data for Basic Information were used for students taking Basic Information, an on-demand course. Students who tended to be absent from school were defined as those who were absent from Basic Information for more than three consecutive weeks. We then used the features extracted in the previous study to make multiple predictions in a random forest per week. The data were generated by under-sampling, a method used for imbalanced data, and by cluster classification. Ensemble learning was performed on the created models. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12496725 |
書誌情報 |
研究報告教育学習支援情報システム(CLE)
巻 2023-CLE-39,
号 4,
p. 1-7,
発行日 2023-03-03
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8620 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |