System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于序列对比和信息瓶颈原则的知识追踪方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

基于序列对比和信息瓶颈原则的知识追踪方法技术

技术编号:40331412 阅读:9 留言:0更新日期:2024-02-09 14:23
本发明专利技术公开了一种基于序列对比和信息瓶颈原则的知识追踪方法,包括如下步骤:采集学生历史答题序列,将学生历史答题序列输入到经过训练的无偏知识状态抽取器模块进行预测,得到预测无偏知识状态概率向量,由激活函数选择概率最大的类作为下一时刻的学生答题预测结果序列数据,从而实现知识追踪。本发明专利技术以深度学习思想为核心,引入序列数据增强模块以捕获交互数据的动态特性,引入Transformer编码器对学生知识状态进行编码,引入信息瓶颈原则以构建第二损失,并通过早停策略强化对有偏关系的提取,并通过序列对比学习和信息瓶颈原则得到无偏的学生认知表示,当数据集中存在学生抄袭、猜测等时,本发明专利技术的无偏知识状态抽取器模块的性能更为稳定。

【技术实现步骤摘要】

本专利技术属于智慧教育领域,尤其涉及一种基于序列对比和信息瓶颈原则的知识追踪方法


技术介绍

1、人工智能技术的进步极大促进了计算机辅助教育系统的发展。随着教育信息化的逐步普及,在线教育平台如慕课、智能辅导系统等得到广泛应用,并累计了大量学生解题的数据。知识追踪,作为计算机辅助系统的关键任务,旨在理解学生的知识掌握程度并预测之后的解题表现。

2、具体而言,知识追踪是一个学习模型,通过学生的历史答题记录,来预测学生是否能够正确回答下一个问题。现有的知识追踪方法可分为贝叶斯模型、因子分析模型和基于深度学习的模型。

3、贝叶斯模型假设学生的知识状态为一组二元变量的集合,每个变量表达学生是否掌握一个单独的知识点。20世纪90年代提出的bkt(bayesian knowledge tracing),使用隐马尔科夫模型,通过学生在问题上的实际表现来更新学生的知识状态。然而,该模型并没有考虑学生能力的差异和同属于一个知识点之间问题的差异性。因子分析模型则考虑引入更多影响学生知识状态的因子,例如项目反映理论(itemresponse theory,irt)引入问题难度和学生能力,表现因子分析(performance factors analysis,pfa)引入学生对某个知识点相关题目答对和答错次数,然而现有的基于深度学习的方法通常假设学生与教学系统的交互行为可以直接反映他们的知识状态。此外现实场景中的学生交互数据经常存在噪声,例如学生在学习过程中由于缺乏兴趣等原因,会在完成课业的过程中存在抄袭、瞎蒙等行为。这些行为的存在使得当前依赖这些数据的深度学习模型难以得到可信赖的预测结果,从而不能反映学生的真实知识状态,且忽略了问题和知识点之间多样的依赖关系。


技术实现思路

1、本专利技术的目的在于解决现有技术中存在的问题,并提供一种基于序列对比和信息瓶颈原则的知识追踪方法。

2、本专利技术所采用的具体技术方案如下:

3、一种基于序列对比和信息瓶颈原则的知识追踪方法,包括以下步骤:

4、获取一个经过预训练的无偏知识状态抽取器模块,将采集到的学生历史答题序列输入到所述无偏知识状态抽取器模块中,对下一时刻的待回答问题数据进行答案预测,得到每个预测无偏知识状态概率向量,由激活函数选择概率最大的预测无偏知识状态作为下一时刻的学生答题预测结果序列数据,从而实现知识追踪;

5、所述无偏知识状态抽取器模块的训练过程为:

6、s1.以每个学生为单位,采集多个学生原始交互序列数据并构成数据集,利用序列数据增强模块对每个学生原始交互序列数据进行数据增强处理,每个学生原始交互序列数据均会对应得到两个新生成的学生答题序列数据,并将一个学生原始交互序列数据和两个所述新生成的学生答题序列数据作为一个训练样本;其中,每个学生原始交互序列数据均包括一个原始答案序列和一个原始问题序列;两个新生成的学生答题序列数据为第一新生成的学生答题序列数据和第二新生成的学生答题序列数据;每个新生成的学生答题序列数据均包括一个答案序列和一个问题序列;

7、s2.无偏知识状态抽取器模块的网络参数进行随机初始化,将所有训练样本对输入初始化后的无偏知识状态抽取器模块中,每个学生原始交互序列数据均会对应得到一个随机无偏学生知识状态表示;

8、s3.将所有训练样本输入到一个有偏知识状态抽取器模块中,每个学生原始交互序列数据均会对应得到一个原始有偏学生知识状态表示,每个新生成的学生答题序列数据均会对应得到一个新生成有偏学生知识状态表示;基于所述新生成的学生答题序列数据计算对比损失,基于所述答案序列和所述原始有偏学生知识状态表示计算交叉熵损失,对有偏知识状态抽取器模块的网络参数进行梯度下降更新;

9、s4.将所有原始有偏学生知识状态表示和所有随机无偏学生知识状态表示一起输入到一个判别器模块中,得到特征值;基于第一损失对所述判别器模块的网络参数进行梯度下降更新;

10、s5.将所有训练样本输入到初始化后的无偏知识状态抽取器模块中,每个学生原始交互序列数据均会对应得到一个原始无偏学生知识状态表示,每个新生成的学生答题序列数据均会对应得到一个新生成无偏学生知识状态表示;引入信息瓶颈原则,利用所述第一损失、所述对比损失和所述交叉熵损失构建第二损失,对初始化后的无偏知识状态抽取器模块的网络参数进行梯度下降更新;

11、s6.将所有原始无偏学生知识状态表示和所有原始有偏学生知识状态表示一起输入到所述判别器模块中,基于原始有偏学生知识状态表示和原始无偏学生知识状态表示更新第一损失,用于所述判别器模块下一个迭代轮次的训练,直到达到指定迭代次数后,模型收敛,训练完毕;否则重复执行步骤s4-s6。

12、作为优选,所述对比损失lcl的函数形式为:

13、

14、其中,表示所述第一新生成的学生答题序列数据;表示所述第二新生成的学生答题序列数据;b表示批量大小;τ为温度参数。

15、作为优选,所述第一损失ld的函数形式为:

16、

17、其中,dφ(·)为所述判别器模块dφ;z为所述原始无偏学生认知表示;为所述原始有偏学生认知表示;为在所述判决器模块中将所述原始有偏学生认知表示按行随机打乱后的认知表示。

18、作为优选,所述第二损失lc的函数形式为:

19、lc=αld-lce+lcl

20、其中,α为权重参数;lce为所述交叉熵损失。

21、作为优选,所述权重参数α为0.01。

22、作为优选,所述判别器模块dφ采用2个全连接层依次级联而成。

23、作为优选,所述有偏知识状态抽取器模块和所述无偏知识状态抽取器模块均采用transformer编码器。

24、作为优选,所述序列数据增强模块在每次执行数据增强过程中,由数据裁剪、数据掩码或数据重排三种方式中随机选择两种,用于对新生成的学生答题序列数据进行数据增强。

25、作为优选,所述批量大小b为128。

26、本专利技术相对于现有技术而言,具有以下有益效果:

27、1)本专利技术引入了transformer编码器对学生知识状态进行编码,并通过序列对比学习和信息瓶颈原则得到无偏的学生认知表示,本专利技术与其他传统的深度学习方法相比,本专利技术提出的方法在ednet开源数据集上进行测试时的area under curve(auc)为0.7606。

28、2)本专利技术提出的方法不仅能够对无偏学生历史答题序列数据进行有效的预测,在人为模拟噪声形成有偏情况下,即当数据集中存在学生抄袭、猜测等时,无偏知识状态抽取器模块与其他模型相比,其性能相比也更为稳定,在有偏学生历史答题序列不超过30%的情况下,其性能下降比例不超过5%。

本文档来自技高网...

【技术保护点】

1.一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述对比损失LCL的函数形式为:

3.如权利要求2所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述第一损失LD的函数形式为:

4.如权利要求3所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述第二损失LC的函数形式为:

5.如权利要求4所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述权重参数α为0.01。

6.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述判别器模块Dφ采用2个全连接层依次级联而成。

7.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述有偏知识状态抽取器模块和所述无偏知识状态抽取器模块均采用Transformer编码器。

8.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述序列数据增强模块在每次执行数据增强过程中,由数据裁剪、数据掩码或数据重排三种方式中随机选择两种,用于对新生成的学生答题序列数据进行数据增强。

9.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述批量大小B为128。

10.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述学生原始交互序列数据来源于EdNet数据集。

...

【技术特征摘要】

1.一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述对比损失lcl的函数形式为:

3.如权利要求2所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述第一损失ld的函数形式为:

4.如权利要求3所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述第二损失lc的函数形式为:

5.如权利要求4所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述权重参数α为0.01。

6.如权利要求1所述的一种基于序列对比和信息瓶颈原则的知识追踪方法,其特征在于,所述判别器模块dφ采用2个全连接层...

【专利技术属性】
技术研发人员:陈静远吕祥伟王桂凤吴飞
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1