System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于增强动态键值记忆网络的知识追踪方法技术_技高网

基于增强动态键值记忆网络的知识追踪方法技术

技术编号:40943440 阅读:9 留言:0更新日期:2024-04-18 15:00
本发明专利技术公开的基于增强动态键值记忆网络的知识追踪方法,包括以下步骤:步骤1、构建增强的动态键值记忆网络模型,动态评估学生的学习能力和练习题的难度;步骤2、采用K‑means聚类算法根据步骤1所得学生的学习能力对学生分组;步骤3、根据步骤1所得练习题的难度、步骤2所得学生分组结果及练习题的技能与回答正确率二元组构建丰富的模型输入特征;步骤4、根据步骤3所得模型输入特征进行长期序列建模并输出预测结果。本发明专利技术的基于增强动态键值记忆网络的知识追踪方法,解决了在利用现有技术评估学生技能学习能力时准确度低导致无法准确开展个性化教学支持的问题。

【技术实现步骤摘要】

本专利技术属于智慧教育,具体涉及基于增强动态键值记忆网络的知识追踪方法


技术介绍

1、知识追踪(knowledge tracking,kt)旨在根据学生与过去练习题之间的交互序列来预测学生的未来表现,并跟踪他们技能掌握水平随时间的变化。

2、传统的kt模型主要包括贝叶斯知识追踪、表现因子分析和知识追踪机等。然而,这些模型使用简单的离散随机状态变量,这导致它们难以建模复杂的知识结构和关系;另外,这些模型假设当前的学习状态只与前一个状态有关,忽略了更长期的依赖关系,因此在处理一些需要先前多个状态的kt任务时性能下降。近年来,许多学者在kt领域广泛运用深度学习技术。深度知识追踪(deep knowledge tracing,dkt)是最早将深度学习技术应用于知识追踪的模型,随后,出现了一系列改进dkt的方法。例如,动态键值记忆网络、深度项目反应理论和练习感知知识追踪等。

3、与传统kt模型相比,深度学习kt模型能够学习到更复杂、更抽象的知识结构和关系,也能捕捉到更长期的信息。然而,它们将所有学生视为一个整体,没有考虑到学生之间的个体差异。针对这一问题,有学者提出了具有动态学生分类的深度知识追踪和记忆网络上的动态学生分类。上述两个模型都是根据学生的学习能力对学生进行分组,并以组为单位进行训练,继而为学生提供更个性化的指导。具体地,上述两个模型在每个时间间隔上直接统计原始数据集的correct字段中1或0的个数,计算出正确率和错误率之间的差值并将其表示为学生的学习能力。然而,一方面,作差法表示学生能力的方法非线性建模能力不足,且不够细粒度;另一方面,长期序列建模时容易出现过拟合问题。


技术实现思路

1、本专利技术的目的在于提供基于增强动态键值记忆网络的知识追踪方法,解决了在利用现有技术评估学生技能学习能力时准确度低导致无法准确开展个性化教学支持的问题。

2、本专利技术所采用的技术方案是:基于增强动态键值记忆网络的知识追踪方法,包括以下步骤:

3、步骤1、构建增强的动态键值记忆网络模型,动态评估学生的学习能力和练习题的难度;

4、步骤2、采用k-means聚类算法根据步骤1所得学生的学习能力对学生分组;

5、步骤3、根据步骤1所得练习题的难度、步骤2所得学生分组结果及练习题的技能与回答正确率二元组构建丰富的模型输入特征;

6、步骤4、根据步骤3所得模型输入特征进行长期序列建模并输出预测结果。

7、本专利技术的特点还在于,

8、步骤1具体包括以下步骤:

9、步骤1.1、考虑技能之间的先决关系来计算查询向量与静态键矩阵之间的相关权重;

10、步骤1.2、通过读操作预测学生正确回答练习题的概率;

11、步骤1.3、根据学生的作答情况并结合学生当前的知识掌握状态来更新值矩阵;

12、步骤1.4、通过学生对技能的掌握程度进一步抽象来表示学生的学习能力,对练习题的嵌入进一步抽象来表示练习题的难度。

13、步骤1.1具体包括以下步骤:

14、步骤1.1.1、计算模型输入即练习题涉及技能的连续向量表示,记为嵌入向量kt;

15、步骤1.1.2、利用先决关系编码矩阵建模技能之间存在的先决关系,计算公式如下:

16、(mk)′=mk(1+p)

17、

18、其中,p是技能间的先决关系矩阵,p∈{0,1}|n|×|n|是一个二元矩阵,如果技能sk1∈k是技能sk2∈k的先决条件,则p[sk1,sk2]=1,否则p[sk1,sk2]=0;mk是存储所有技能的静态键矩阵,n是技能数量,是全体实数,dk是存储槽维度,(mk)′是考虑了技能之间先决关系的静态键矩阵;

19、步骤1.1.3、通过嵌入向量kt与增强的键矩阵(mk)′中的每个存储槽(mk(i))′做内积,再通过softmax层激活得到相关权重。

20、步骤1.2具体包括以下步骤:

21、步骤1.2.1、利用步骤1.1计算得到的相关权重对动态值矩阵的所有存储槽进行加权并求和,获得读取向量;

22、步骤1.2.2、将读取向量与练习题自身进行拼接传递到tanh层获得包含了学生的技能掌握水平和练习题难度信息的汇总向量ft。

23、步骤1.3具体包括以下步骤:

24、步骤1.3.1、通过学生的作答情况(st,at)与嵌入矩阵b相乘得到技能增长向量vt;

25、步骤1.3.2、使用注意力机制将包含了汇总向量ft与技能增长向量vt进行融合,计算公式如下:

26、α=softmax(w1ft+wvvt+b1)

27、

28、其中,w1和wv是可学习的权重矩阵,b1是偏差向量,α是更新值矩阵时ft和vt的重要性,是学生的自适应技能增长;

29、步骤1.3.3、将技能增长写入值矩阵,对值矩阵进行更新。

30、步骤1.4具体为:将汇总向量ft作为增强的动态键值记忆网络模型全连接层的输入,再通过tanh层激活得到学生的学习能力;将嵌入向量kt传递给一个全连接层,再通过tanh层激活得到练习题的难度;计算公式如下:

31、θtj=tanh(wθft+bθ)

32、βj=tanh(wβkt+bβ)

33、其中,wθ和wβ是权重矩阵,bθ和bβ是偏差向量,θtj是学生在时间步t对练习题涉及的技能j的学习能力,βj是练习题的难度;学生sti在第z个时间间隔内的学习能力定义如下:

34、

35、其中,是学生sti在第z个时间间隔内对不同技能的学习能力,矩阵中的每个元素θtj是学生sti在时间步t对技能j的学习能力;矩阵的行表示不同的技能,列表示不同的时间步;是学生学习能力的细粒度非线性的表示;学生sti在时间间隔1到z对所有技能的学习能力计算公式如下:

36、

37、

38、

39、其中,θzj是学生sti在第z个时间间隔内对技能j的整体学习能力,(θj)1:z是学生sti从时间间隔1到z对技能j的整体学习能力,是形状为1×n的向量,其中每个元素表示学生sti从时间间隔1到z对相应技能的平均学习能力。

40、步骤3具体为:给定学生的做题记录x={x1,x2,…,xt},其中xt=(st,at),at∈{0,1},st是学生在t时间步上所做的练习题涉及的技能;at是相应的得分情况,at=1表示回答正确,at=0表示回答错误;将xt的one-hot编码嵌入向量xt与t时间步上学生所属分组ct和练习题难度dt拼接构建丰富的模型输入特征。

41、步骤4中采用循环门控单元gru作为学生知识状态随时间变化的序列建模工具,具体为:在隐藏层中,将响应序列划分为多个时间间隔,每个时间间隔的最后一个节点作为下一个时间间隔的第一个节点;对于时间间隔z内的时间步t,本文档来自技高网...

【技术保护点】

1.基于增强动态键值记忆网络的知识追踪方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1具体包括以下步骤:

3.如权利要求2所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.1具体包括以下步骤:

4.如权利要求3所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.2具体包括以下步骤:

5.如权利要求4所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.3具体包括以下步骤:

6.如权利要求5所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.4具体为:将汇总向量ft作为增强的动态键值记忆网络模型全连接层的输入,再通过Tanh层激活得到学生的学习能力;将嵌入向量kt传递给一个全连接层,再通过Tanh层激活得到练习题的难度;计算公式如下:

7.如权利要求1所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤3具体为:给定学生的做题记录x={x1,x2,…,xt},其中xt=(st,at),at∈{0,1},st是学生在t时间步上所做的练习题涉及的技能;at是相应的得分情况,at=1表示回答正确,at=0表示回答错误;将xt的one-hot编码嵌入向量xt与t时间步上学生所属分组ct和练习题难度dt拼接构建丰富的模型输入特征。

8.如权利要求1所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤4中采用循环门控单元GRU作为学生知识状态随时间变化的序列建模工具,具体为:在隐藏层中,将响应序列划分为多个时间间隔,每个时间间隔的最后一个节点作为下一个时间间隔的第一个节点;对于时间间隔z内的时间步t,将上一时间步的隐藏状态ht-1和当前时间步的输入xt联合作为GRU的输入,计算当前时间步的隐藏状态;然后,将当前时间步GRU的输出向量ht作为Sigmoid层的输入,经过Sigmoid层处理得到输出yt。

...

【技术特征摘要】

1.基于增强动态键值记忆网络的知识追踪方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1具体包括以下步骤:

3.如权利要求2所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.1具体包括以下步骤:

4.如权利要求3所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.2具体包括以下步骤:

5.如权利要求4所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.3具体包括以下步骤:

6.如权利要求5所述的基于增强动态键值记忆网络的知识追踪方法,其特征在于,所述步骤1.4具体为:将汇总向量ft作为增强的动态键值记忆网络模型全连接层的输入,再通过tanh层激活得到学生的学习能力;将嵌入向量kt传递给一个全连接层,再通过tanh层激活得到练习题的难度;计算公式如下:

7.如权利要求1所述的基于增...

【专利技术属性】
技术研发人员:王磊张欢欢李薇屈禹先杜昌山
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1