WEKO3
アイテム
LDAを用いた類似項目検索のための前処理法
https://ipsj.ixsq.nii.ac.jp/records/96711
https://ipsj.ixsq.nii.ac.jp/records/96711c2cae398-1458-48a0-936e-f26a38005093
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-12-06 | |||||||
タイトル | ||||||||
タイトル | LDAを用いた類似項目検索のための前処理法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Method of Preprocessing for Retrieving Similar Test Items Using Latent Dirichlet Allocation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
電気通信大学大学院情報システム学研究科/日本学術振興会特別研究員DC2 | ||||||||
著者所属 | ||||||||
岩手県立大学ソフトウェア情報学部 | ||||||||
著者所属 | ||||||||
東京電機大学未来科学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Systems, University of Electro-Communications / JSPS Research Fellow | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Software and Information Science, Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Science and Technology for Future Life, Tokyo Denki University | ||||||||
著者名 |
高木, 輝彦
× 高木, 輝彦
|
|||||||
著者名(英) |
Teruhiko, Takagi
× Teruhiko, Takagi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究ではこれまで,多肢選択式項目を対象とした類似項目の自動検索を目的とし,項目間類似度の算出手法を提案してきた.類似度データや類似項目を用いることで,(1)類似項目の自動検索,(2)自動的なアイテム・バンクの構築,(3)項目間構造の可視化,(4)テスト情報量の向上,(5)新規項目の難易度の推定,(6)適応的なテストの出題,(7)項目の作成,などの支援が可能となる.これまでの手法は,出現する語を特徴量としたベクトルの生成(発見的アプローチ)と,語の共起性から確率的に推定されるトピックを特徴量としたベクトルの生成(確率的アプローチ),の大きく 2 つのアプローチに分類され,確率的アプローチは発見的アプローチの不要語による誤検索や表記ゆれによる検索漏れなどの課題解決が示唆された.トピックの推定では,代表的なトピックモデルである Latent Dirichlet Allocation(LDA)を用いる.本論文では,類似項目の検索精度の向上を目的とし,LDA を用いた類似項目検索のための前処理法を提案する.多肢選択式の 250 項目を対象とした類似項目の検索実験を行った結果,提案手法では,既存手法に比べ類似項目の検索精度が最も高かった.これらの実験・評価結果から,前処理法の有効性が示唆された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In previous studies, to retrieve similar test items automatically in e-testing, we proposed methods of calculating similarity between test items based on the vector space model, and conducted experiments and evaluations. It is possible to apply similarity data or similar test items to (1) automatically retrieving similar test items, (2) automatically constructing item banks, (3) visualizing structure between test items, (4) optimizing the amount of test information, (5) estimating the difficulty level of unanswered test items, (6) computer adaptive testing (CAT), and (7) supporting the creation of test items. Our methods in previous studies are classified into heuristic approach and probabilistic approach. In the heuristic approach, each test item is represented by a vector using extracted terms from these test items. In the probabilistic approach, each test item is represented by a vector using topics probabilistically estimated by the co-occurrence relation between terms. The probabilistic approach can decrease the number of retrieved dissimilar test items caused by noise such as superfluous terms and spelling variations in the heuristic approach. We have applied Latent Dirichlet Allocation (LDA), a generative probabilistic document model, to topic estimation. In this paper, to improve the accuracy of retrieving similar test items, we propose a method of preprocessing for retrieving similar test items using LDA. We targeted 250 multiple-choice test items tested by Systems Administrator Examination and conducted an experiment where similar items are retrieved. The result of the experiment showed the improvement in accuracy of the proposed method in comparison with existing methods, and it proved the effectiveness of the method of preprocessing. | |||||||
書誌情報 |
情報教育シンポジウム2013論文集 巻 2013, 号 2, p. 85-92, 発行日 2013-08-11 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |