当前位置: 首页 > 专利查询>北京大学专利>正文

基于对抗训练的知识追踪增强方法及装置制造方法及图纸

技术编号:38754282 阅读:5 留言:0更新日期:2023-09-10 09:39
本发明专利技术公开了一种基于对抗训练的知识追踪增强方法及装置,涉及智慧教育领域。所述方法包括:构建训练集,所述训练集包括若干个原始知识点记录集合及相应答题记录集合;根据原始知识点记录集合及相应答题记录集合,计算表征测试者各个时间步答题情况的交互嵌入表示;生成所述交互嵌入表示的对抗交互嵌入表示;基于所有交互嵌入表示与对抗交互嵌入表示,训练一深度神经网络,得到知识追踪模型;依据所述知识追踪模型,得到测试者的知识追踪结果。本发明专利技术能够更加有效增强知识追踪效果,提升学生知识点掌握度的量化表示能力。知识点掌握度的量化表示能力。知识点掌握度的量化表示能力。

【技术实现步骤摘要】
基于对抗训练的知识追踪增强方法及装置


[0001]本专利技术涉及智慧教育领域,尤其涉及一种基于对抗训练的知识追踪增强方法及装置,能够更加有效增强知识追踪效果,提升学生知识点掌握度的量化表示能力。

技术介绍

[0002]教育一直是社会热点话题。得益于数字多媒体技术的迅速发展,智慧教育也受到了越来越多的关注。其中,知识追踪被认为是一项核心任务,其目的是对学生做题过程中的知识点掌握度进行追踪。具体来说,知识追踪通过学生历史做题记录来预测其做对下一道题目的概率,并将预测概率视为学生对相应知识点的掌握度。在此基础上,通过时序化预测对学生知识点掌握度进行动态追踪。图1为学生练习过程示意图。学生练习了前四道题目,其中答对第一、第二和第四道题目,答错第三道题目。利用知识追踪,可通过学生前四道题目回答情况来预测其答对第五道题目的概率,进而评估该学生对相应知识点的掌握度。该技术不仅可帮助学生更好地了解自身知识点掌握情况,也可为后续的个性化题目推荐任务提供决策支持。
[0003]作为智慧教育领域重要课题,知识追踪受到了研究者的持续关注。在早期工作中,研究者主要沿着概率模型技术路线开展研究。该技术路线假设学生学习过程遵循马尔科夫过程,并通过观察学生学习表现来对其知识点掌握度进行估计。基于贝叶斯的知识追踪方法 (Bayesian Knowledge Tracing,BKT)是其中代表性方法之一。该方法将学生知识点掌握度形式化为一组二元变量,并利用隐马尔可夫模型来更新知识点掌握度,取得了良好追踪效果。后续工作在BKT基础上进行了拓展,通过融入更多先验信息,如题目难度、猜对概率等来进一步提升效果。虽然这些工作取得了良好效果,但仍存在两大缺陷。首先,这些方法的前提假设往往过于简单,一定程度上不符合现实学习规律,如“学习过程中不存在遗忘”。此外,这些方法大多依赖于手工特征建模方式,未考虑更多潜在建模因素,进一步限制了算法性能。
[0004]得益于深度神经网络(Deep Neural Networks,DNN)良好的表征能力,近年来越来越多的研究者聚焦于利用DNN来建模知识追踪任务,并做出了一些有益探索。大体来讲,这些方法往往基于循环神经网络和注意力机制,代表性方法有深度知识追踪方法(Deep KnowledgeTracing,DKT)、基于自注意力机制的知识追踪方法(Self

Attentive Knowledge Tracing, SAKT)、基于上下文注意力机制的知识追踪方法(Context

Aware Attentive KnowledgeTracing,AKT)等。较之传统基于手工特征建模的方法,这些基于DNN以数据驱动方式建模的知识追踪方法取得了更好的性能。然而,这些方法依然存在过拟合风险,尤其是在小规模数据集上。为追求更好的追踪效果,模型的泛化性能需要被进一步提升。考虑到对抗训练是一种有效的正则化方式,本专利技术聚焦于利用对抗训练来提升基于DNN的知识追踪模型的泛化能力,进而达到更好的追踪效果。

技术实现思路

[0005]针对基于深度神经网络的知识追踪模型中潜在的过拟合风险,本专利技术公开了一种基于对抗训练的知识追踪增强方法及装置,利用对抗训练来训练知识追踪模型,能够增强知识追踪模型的泛化能力,提升知识追踪效果。
[0006]本专利技术的
技术实现思路
包括:
[0007]一种基于对抗训练的知识追踪增强方法,其步骤包括:
[0008]构建训练集,所述训练集包括若干个原始知识点记录集合及相应答题记录集合;
[0009]根据原始知识点记录集合及相应答题记录集合,计算表征测试者各个时间步答题情况的交互嵌入表示;
[0010]生成所述交互嵌入表示的对抗交互嵌入表示;
[0011]基于所有交互嵌入表示与对抗交互嵌入表示,训练一深度神经网络,得到知识追踪模型;
[0012]依据所述知识追踪模型,得到测试者的知识追踪结果。
[0013]进一步地,所述计算表征测试者各个时间步答题情况的交互嵌入表示,,包括:
[0014]1)将原始知识点记录集合及相应答题记录集合中的每一原始知识点记录s
j
与答题记录a
j
,映射为原始知识点嵌入表示与学生答题记录嵌入表示其中,j为编号,原始知识点记录 s
j
与答题记录a
j
基于时间顺序排列;
[0015]2)拼接原始知识点嵌入表示与学生答题记录嵌入表示得到所述交互嵌入表示e
j

[0016]进一步地,所述交互嵌入表示所述交互嵌入表示表示维度拼接运算符,a
j
=1 表示答对题目,a
j
=0表示答错题目。
[0017]进一步地,所述生成所述交互嵌入表示的对抗交互嵌入表示,包括:
[0018]1)产生交互嵌入表示e
j
‑1的对抗扰动r


[0019]2)将对抗扰动r

添加至交互嵌入表示e
j
‑1上,生成对抗交互嵌入表示e

j
‑1。
[0020]进一步地,对抗扰动其中ε为控制对抗扰动幅度的参数,θ为深度神经网络参数,L为训练深度神经网络的损失函数。
[0021]进一步地,所述深度神经网络包括:
[0022]长短期记忆网络,用以基于交互嵌入表示或对抗交互嵌入表示,捕获不同时间步答题情况之间的关系,以得到不同时间步的知识点隐状态信息;
[0023]注意力网络,用以聚合不同时间步的知识点隐状态信息,并强调当前时间步的知识点隐状态信息,以得到知识点隐状态的综合表征;
[0024]全连接层,用以根据所述综合表征,计算知识追踪结果。
[0025]进一步地,所述依据所述知识追踪模型,得到测试者的知识追踪结果,包括:
[0026]1)获取测试者的原始知识点记录集合及相应答题记录集合;
[0027]2)根据测试者的原始知识点记录集合及相应答题记录集合,计算表征测试者各个
时间步答题情况的交互嵌入表示;
[0028]3)将表征测试者各个时间步答题情况的交互嵌入表示,输入知识追踪模型,得到该测试者的知识追踪结果。
[0029]进一步地,所述知识追踪结果包括:答对下一原始知识点记录的概率值。
[0030]一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一所述方法。
[0031]一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一所述方法。
[0032]与现有技术相比,本专利技术至少具有以下优点:
[0033]1、考虑到独热编码无法通过加入轻微扰动来产生有效对抗样本,本专利技术将题目和答题信息改为了嵌入形式并考虑到学生答题情况的不同,来建立交互嵌入表示;
[0034]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于对抗训练的知识追踪增强方法,其步骤包括:构建训练集,所述训练集包括若干个原始知识点记录集合及相应答题记录集合;根据原始知识点记录集合及相应答题记录集合,计算表征测试者各个时间步答题情况的交互嵌入表示;生成所述交互嵌入表示的对抗交互嵌入表示;基于所有交互嵌入表示与对抗交互嵌入表示,训练一深度神经网络,得到知识追踪模型;依据所述知识追踪模型,得到测试者的知识追踪结果。2.如权利要求1所述的方法,其特征在于,所述计算表征测试者各个时间步答题情况的交互嵌入表示,包括:1)将原始知识点记录集合及相应答题记录集合中的每一原始知识点记录s
j
与答题记录a
j
,映射为原始知识点嵌入表示与学生答题记录嵌入表示其中,j为编号,原始知识点记录s
j
与答题记录a
j
基于时间顺序排列;2)拼接原始知识点嵌入表示与学生答题记录嵌入表示得到所述交互嵌入表示e
j
。3.如权利要求2所述的方法,其特征在于,所述交互嵌入表示所述交互嵌入表示表示维度拼接运算符,a
j
=1表示答对题目,a
j
=0表示答错题目。4.如权利要求2所述的方法,其特征在于,所述生成所述交互嵌入表示的对抗交互嵌入表示,包括:1)产生交互嵌入表示e
j
‑1的对抗扰动r

;2)将对抗扰动r

添加至交互嵌入表示e
j
‑1...

【专利技术属性】
技术研发人员:孙俊郭晓鹏黄志杰
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1