System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 知识点预测模型训练、知识点预测方法及装置制造方法及图纸_技高网

知识点预测模型训练、知识点预测方法及装置制造方法及图纸

技术编号:40963087 阅读:5 留言:0更新日期:2024-04-18 20:42
本发明专利技术提供一种知识点预测模型训练、知识点预测方法及装置,涉及人工智能技术领域,该方法包括:将第一样本试题的原始的题面文本输入至大型语言模型,得到第一样本试题的推理的解析文本;基于第一样本试题的原始的题面文本、推理的解析文本和知识点标签,以及第二样本试题的原始的题面文本、原始的解析文本和知识点标签,对初始多任务预测模型进行训练,得到知识点预测模型;知识点预测模型用于基于目标试题的原始的题面文本,预测得到目标试题的知识点预测结果;本发明专利技术实现以包含题面文本、解析文本以及知识点标签的多维度特征的样本数据集联合进行初始多任务预测模型训练,使得得到的知识点预测模型能够针对各种试题的知识点进行精准预测。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种知识点预测模型训练、知识点预测方法及装置


技术介绍

1、在教育领域中,知识点作为串接试题与教学资源之间的关键一环,其重要价值是不可忽略的。但是,知识点的加工标注需要具有专业教学经验的专家和老师投入大量人力,这不利于教育资源的合理应用。因此,有越来越多的教育从业者,尝试使用人工智能技术,对试题文本进行分析,预测其相关知识点,并与对应的教学资源进行关联,构建对应的知识图谱,最终做到针对不同学生的学习数据,分析其薄弱的知识点,并为其规划合理的学习路线以及查漏补缺的方法。这对于推动教育的个性化与智能化,有着至关重要的意义。

2、通常试题文本数据可以大致分为题面文本和解析文本两部分,但是由于解析文本收集困难,因此现有技术通常以试题题面文本作为输入,进行知识点预测;而由于试题题面文本中所包含的知识点信息有效,因此,此种仅依赖题面文本进行知识点预测,无法从题面文本中提取出解题思路、解题步骤等与知识点强相关的特征,从而限制了知识点预测的精度。


技术实现思路

1、本专利技术提供一种知识点预测模型训练、知识点预测方法及装置,用以解决现有技术中知识点预测较低的缺陷,实现提高知识点预测的精度。

2、本专利技术提供一种知识点预测模型训练方法,包括:

3、将第一样本试题的原始的题面文本输入至大型语言模型,得到所述第一样本试题的推理的解析文本;

4、基于所述第一样本试题的原始的题面文本、推理的解析文本和知识点标签,以及第二样本试题的原始的题面文本、原始的解析文本和知识点标签,对初始多任务预测模型进行训练,得到知识点预测模型;所述知识点预测模型用于基于目标试题的原始的题面文本,预测得到所述目标试题的知识点预测结果;

5、其中,所述第一样本试题为解析文本缺失的试题,所述第二样本试题为解析文本正常的试题。

6、根据本专利技术提供一种知识点预测模型训练方法,所述基于所述第一样本试题的原始的题面文本、推理的解析文本和知识点标签,以及第二样本试题的原始的题面文本、原始的解析文本和知识点标签,对初始多任务预测模型进行训练,得到知识点预测模型,包括:

7、基于所述第一样本试题的原始的题面文本和推理的解析文本,以及所述第二样本试题的原始的题面文本和原始的解析文本,生成正样本对和负样本对;所述正样本对中的题面文本和解析文本属于同一样本试题,所述负样本对中的题面文本和解析文本属于不同样本试题;

8、基于所述正样本对和所述负样本对,对所述初始多任务预测模型的文本编码层进行对比学习预训练,得到预训练多任务预测模型;

9、将所述第一样本试题的原始的题面文本和推理的解析文本输入至所述预训练多任务预测模型,得到所述第一样本试题的知识点预测结果,将所述第二样本试题的原始的题面文本和原始的解析文本输入至所述预训练多任务预测模型,得到所述第二样本试题的知识点预测结果;

10、基于所述第一样本试题的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的知识点预测结果与所述第二样本试题的知识点标签之间的差异,对所述预训练多任务预测模型进行微调训练,得到所述知识点预测模型。

11、根据本专利技术提供一种知识点预测模型训练方法,所述预训练多任务预测模型包括预训练的文本编码层、题面专家网络层、解析专家网络层和多任务预测层,所述多任务预测层包括题面预测分支网络层,以及解析预测分支网络层;

12、所述将所述第一样本试题的原始的题面文本和推理的解析文本输入至所述预训练多任务预测模型,得到所述第一样本试题的知识点预测结果,包括:

13、将所述第一样本试题的原始的题面文本和推理的解析文本输入至所述预训练的文本编码层,得到所述第一样本试题的原始的题面文本的表征向量和所述第一样本试题的推理的解析文本的表征向量;

14、将所述第一样本试题的原始的题面文本的表征向量输入至所述题面专家网络层,得到所述第一样本试题的第一知识点决策信息,将所述第一样本试题的推理的解析文本的表征向量输入至所述解析专家网络层,得到所述第一样本试题的第二知识点决策信息;

15、将所述第一知识点决策信息输入至所述题面预测分支网络层,得到所述第一样本试题的原始的题面文本对应的知识点预测结果,将所述第二知识点决策信息输入至所述解析预测分支网络层,得到所述第一样本试题的推理的解析文本对应的知识点预测结果。

16、根据本专利技术提供一种知识点预测模型训练方法,所述基于所述第一样本试题的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的知识点预测结果与所述第二样本试题的知识点标签之间的差异,对所述预训练多任务预测模型进行微调训练,得到所述知识点预测模型,包括:

17、基于所述第一样本试题的原始的题面文本对应的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的原始的题面文本对应的知识点预测结果与所述第二样本试题的知识点标签之间的差异,确定第一预测损失函数;

18、基于所述第一样本试题的推理的解析文本对应的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的原始的解析文本对应的知识点预测结果与所述第二样本试题的知识点标签之间的差异,确定第二预测损失函数;

19、基于预设权重,对所述第一预测损失函数和所述第二预测损失函数进行加权求和,得到目标预测损失函数;

20、以最小化所述目标预测损失函数为目标,对所述预训练的文本编码层、所述题面专家网络层、所述解析专家网络层和所述多任务预测层进行模型参数优化,得到所述知识点预测模型。

21、根据本专利技术提供一种知识点预测模型训练方法,所述基于所述正样本对和所述负样本对,对所述初始多任务预测模型的文本编码层进行对比学习预训练,得到预训练多任务预测模型,包括:

22、将所述正样本对输入至所述文本编码层,得到所述正样本对中的题面文本的文本表征向量和解析文本的文本表征向量;

23、将所述负样本对输入至所述文本编码层,得到所述负样本对中的题面文本的文本表征向量和解析文本的文本表征向量;

24、以最小化所述正样本对中的题面文本的文本表征向量和解析文本的文本表征向量之间的相似度,以及最大化所述负样本对中的题面文本的文本表征向量和解析文本的文本表征向量之间的相似度为目标,对所述文本编码层进行对比学习预训练,得到所述预训练多任务预测模型。

25、根据本专利技术提供一种知识点预测模型训练方法,在所述将第一样本试题的原始的题面文本输入至大型语言模型,得到所述第一样本试题的推理的解析文本之前,所述方法还包括:

26、根据第二样本试题的原始的题面文本和原始的解析文本构建语料对;

27、基于所述语料对,对初始大型模型进行微调训练,得到所述大型语言模型。

28、本专利技术还提供一种知识点预测方法,包括:本文档来自技高网...

【技术保护点】

1.一种知识点预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的知识点预测模型训练方法,其特征在于,所述基于所述第一样本试题的原始的题面文本、推理的解析文本和知识点标签,以及第二样本试题的原始的题面文本、原始的解析文本和知识点标签,对初始多任务预测模型进行训练,得到知识点预测模型,包括:

3.根据权利要求2所述的知识点预测模型训练方法,其特征在于,所述预训练多任务预测模型包括预训练的文本编码层、题面专家网络层、解析专家网络层和多任务预测层,所述多任务预测层包括题面预测分支网络层,以及解析预测分支网络层;

4.根据权利要求3所述的知识点预测模型训练方法,其特征在于,所述基于所述第一样本试题的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的知识点预测结果与所述第二样本试题的知识点标签之间的差异,对所述预训练多任务预测模型进行微调训练,得到所述知识点预测模型,包括:

5.根据权利要求2所述的知识点预测模型训练方法,其特征在于,所述基于所述正样本对和所述负样本对,对所述初始多任务预测模型的文本编码层进行对比学习预训练,得到预训练多任务预测模型,包括:

6.根据权利要求1-5任一项所述的知识点预测模型训练方法,其特征在于,在所述将第一样本试题的原始的题面文本输入至大型语言模型,得到所述第一样本试题的推理的解析文本之前,所述方法还包括:

7.一种知识点预测方法,其特征在于,包括:

8.根据权利要求7所述的知识点预测方法,其特征在于,所述基于所述目标试题的原始的题面文本和所述目标试题的试题状态,确定输入信息,包括:

9.一种知识点预测模型训练装置,其特征在于,包括:

10.一种知识点预测装置,其特征在于,包括:

11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述知识点预测模型训练方法,或者实现如权利要求7至8任一项所述知识点预测方法。

12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述知识点预测模型训练方法,或者实现如权利要求7至8任一项所述知识点预测方法。

...

【技术特征摘要】

1.一种知识点预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的知识点预测模型训练方法,其特征在于,所述基于所述第一样本试题的原始的题面文本、推理的解析文本和知识点标签,以及第二样本试题的原始的题面文本、原始的解析文本和知识点标签,对初始多任务预测模型进行训练,得到知识点预测模型,包括:

3.根据权利要求2所述的知识点预测模型训练方法,其特征在于,所述预训练多任务预测模型包括预训练的文本编码层、题面专家网络层、解析专家网络层和多任务预测层,所述多任务预测层包括题面预测分支网络层,以及解析预测分支网络层;

4.根据权利要求3所述的知识点预测模型训练方法,其特征在于,所述基于所述第一样本试题的知识点预测结果与所述第一样本试题的知识点标签之间的差异,以及所述第二样本试题的知识点预测结果与所述第二样本试题的知识点标签之间的差异,对所述预训练多任务预测模型进行微调训练,得到所述知识点预测模型,包括:

5.根据权利要求2所述的知识点预测模型训练方法,其特征在于,所述基于所述正样本对和所述负样本对,对所述初始多任务预测模型的文本编码层进行对比学习预训练,得到...

【专利技术属性】
技术研发人员:王士进邵期翔丁亮沙晶刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1