本技术公开了一种基于自适应数据增强的去偏认知诊断方法,包括:1.构造异构数据,包括:学生对习题的答题记录及习题与知识点的关系矩阵;2.通过有选择的数据增强生成偏差数据,并与学生答题记录一起输入偏差认知诊断模型中,并输出偏差预测结果,从而构建偏差认知诊断模型的对称交叉熵损失;3.基于偏差认知诊断模型输出的预测结果,自适应地生成无偏数据,并与学生答题记录一起输入去偏认知诊断模型中进行处理,并输出去偏预测结果,从而构建去偏认知诊断模型的加权交叉熵损失;4.在模型推断阶段,利用建立好的去偏认知诊断模型对学生答题能力进行预测。本发明能缓解认知诊断中的偏差问题。
背景技术
认知诊断是智慧教育领域的一个基本任务,旨在利用学生对习题的答题记录推断学生对知识点的掌握程度。它已经被应用于各种教育场景,如习题推荐,知识追踪和计算机自适应测试。
由于答题记录的稀疏性,现有的认知诊断方法充分利用答题记录来进行学生建模。但是,这些方法继承了机器学习方法固有的弱点:更喜欢学习简单特征。答题记录中存在的简单特征是学生的答题正确率。例如,模型预测答题正确率较高的学生总是能做对习题。这会对认知诊断的准确性和可靠性产生负面影响,尤其应用到分布外的场景。例如,学生平时考试由学校命题,在全省联考里出题人改变,题目风格随之改变,导致学生答题正确率下降。过分依赖学生的答题正确率来进行学生建模会导致模型有偏地诊断。因此,针对这种建模学生表征时利用答题正确率建模存在偏差的场景,考虑认知诊断的去偏,是一项值得研究的问题。
实现思路