试题分类模型的训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:35095263 阅读:15 留言:0更新日期:2022-10-01 16:57
本申请提供了一种试题分类模型的训练方法、装置、设备、介质及产品,模型包括:第一分类层、第二分类层及映射层,方法包括:获取具有相同试题文本的、携带第一标签的第一试题样本及携带第二标签的第二试题样本;通过第一分类层,基于第一试题样本进行分类预测,得到试题文本归属的第一预测节点,并通过第二分类层,基于第二试题样本进行分类预测,得到试题文本归属的第二预测节点;通过映射层,基于教材体系中节点间的关联关系,对第二预测节点进行映射,得到与第二预测节点对应的映射节点;结合第一标签、第二标签、第一预测节点、第二预测节点及映射节点,更新试题分类模型的模型参数。如此,能够提高试题分类模型的训练效率及分类准确性。准确性。准确性。

【技术实现步骤摘要】
试题分类模型的训练方法、装置、设备、介质及程序产品


[0001]本申请涉及人工智能技术,尤其涉及一种试题分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]教学中各科目的教材体系,往往包括章(单元)、节(课)、知识点等在教材体系中处于不同层级的节点,相关技术中,判断试题所对应的节点,如判断试题所归属的知识点,可以通过训练相应的分类模型来实现,然而相关技术中的模型训练方式往往通过构建携带相应节点标签的训练样本,基于构建的训练样本进行相应分类模型的训练,然而若要训练得到的分类模型达到一定准确度,采用该训练方式需要构建大量的训练样本,使得模型的训练效率低。

技术实现思路

[0003]本申请实施例提供一种试题分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提高试题分类模型的训练效率以及分类准确性。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种试题分类模型的训练方法,所述试题分类模型包括:第一分类层、第二分类层及映射层,包括:
[0006]获取具有相同试题文本的第一试题样本及第二试题样本,所述第一试题样本携带第一标签,所述第二试题样本携带第二标签;
[0007]其中,所述第一标签用于指示,在包括多个内容节点的教材体系中,所述试题文本归属的第一节点,所述第二标签用于指示所述试题文本归属的第二节点,所述第一节点与所述第二节点在所述教材体系中处于不同节点层级;
[0008]通过所述第一分类层,基于所述第一试题样本进行分类预测,得到所述试题文本归属的第一预测节点,并通过所述第二分类层,基于所述第二试题样本进行分类预测,得到所述试题文本归属的第二预测节点;
[0009]通过所述映射层,基于所述教材体系中节点间的关联关系,对所述第二预测节点进行映射,得到与所述第二预测节点对应的映射节点,所述映射节点与所述第一预测节点处于相同节点层级;
[0010]结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点,更新所述试题分类模型的模型参数。
[0011]本申请实施例提供一种试题分类模型的训练装置,所述试题分类模型包括:第一分类层、第二分类层及映射层,包括:
[0012]获取模块,用于获取具有相同试题文本的第一试题样本及第二试题样本,所述第一试题样本携带第一标签,所述第二试题样本携带第二标签;其中,所述第一标签用于指示,在包括多个内容节点的教材体系中,所述试题文本归属的第一节点,所述第二标签用于
指示所述试题文本归属的第二节点,所述第一节点与所述第二节点在所述教材体系中处于不同节点层级;
[0013]分类模块,用于通过所述第一分类层,基于所述第一试题样本进行分类预测,得到所述试题文本归属的第一预测节点,并通过所述第二分类层,基于所述第二试题样本进行分类预测,得到所述试题文本归属的第二预测节点;
[0014]映射模块,用于基于所述教材体系中节点间的关联关系,对所述第二预测节点进行映射,得到与所述第二预测节点对应的映射节点,所述映射节点与所述第一预测节点处于相同节点层级;
[0015]更新模块,用于结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点,更新所述试题分类模型的模型参数。
[0016]在上述方案中,所述第一分类层包括第一编码层及第一预测层,所述第二分类层包括第二编码层及第二预测层;其中,所述第一编码层与所述第二编码层共享模型参数;所述分类模块,还用于通过所述第一编码层,对所述第一试题样本进行向量编码,得到第一编码向量,并通过所述第一预测层,基于所述第一编码向量进行分类预测,得到所述试题文本归属的第一预测节点;通过所述第二编码层,对所述第二试题样本进行向量编码,得到第二编码向量,并通过所述第二预测层,基于所述第二编码向量进行分类预测,得到所述试题文本归属的第二预测节点。
[0017]在上述方案中,所述分类模块,还用于通过所述第一编码层,对所述第一试题样本进行分词处理得到多个样本词;分别对各个所述样本词进行编码,得到各所述样本词对应的词向量;对各所述样本词对应的词向量进行向量平均,得到所述第一编码向量。
[0018]在上述方案中,所述分类模块,还用于通过所述第一编码层,对所述第一试题样本进行关键词提取,得到多个关键词;分别对各个所述关键词进行编码,得到各所述关键词对应的关键词向量;获取各所述关键词对应的权重,并基于所述权重对各所述关键词对应的关键词向量进行加权求和,得到所述第一编码向量。
[0019]在上述方案中,所述获取模块,还用于当所述试题文本对应目标试题时,获取所述目标试题的题干、答案及所述答案对应的解析内容;对所述目标试题的题干、答案及所述答案对应的解析内容进行拼接,得到所述试题文本;基于所述试题文本进行标签标注,得到携带所述第一标签的所述第一试题样本及携带所述第二标签的所述第二试题样本。
[0020]在上述方案中,所述更新模块,还用于基于所述第一标签与所述第一预测节点,确定所述第一分类层对应的第一损失函数的值、基于所述第二标签与所述第二预测节点,确定所述第二分类层对应的第二损失函数的值、并基于所述第一标签与所述映射节点,确定所述映射层对应的第三损失函数的值;获取由所述第一损失函数、所述第二损失函数及所述第三损失函数构建的所述试题分类模型的损失函数;基于所述第一损失函数的值、所述第二损失函数的值、及所述第三损失函数的值,确定所述试题分类模型的损失函数的值;基于所述试题分类模型的损失函数的值,更新所述试题分类模型的模型参数。
[0021]在上述方案中,所述装置还包括应用模块,所述应用模块,用于获取待分类试题的试题文本;通过所述第一分类层,对所述待分类试题的试题文本进行分类预测,得到所述待分类试题的试题文本归属的目标节点;或者,通过所述第二分类层,对所述待分类试题的试题文本进行分类预测,得到所述待分类试题的试题文本归属的待映射节点,并通过所述映
射层,基于所述教材体系中节点间的关联关系,对所述待映射节点进行映射,得到待分类试题的试题文本归属的目标节点。
[0022]在上述方案中,所述应用模块,还用于基于所述目标节点,对所述待分类试题进行标注,得到携带标注的标注试题;获取试题纲要,并将所述标注试题的标注与所述试题纲要中的内容进行匹配,得到匹配结果;当所述匹配结果表征所述标注与所述试题纲要中的内容不匹配时,确定所述标注试题为超纲试题。
[0023]在上述方案中,所述装置还包括关联模块,所述关联模块,用于获取所述教材体系对应的节点关联关系表;基于所述节点关联关系表更新所述教材体系中节点间的关联关系。
[0024]在上述方案中,所述教材体系包括多个单元节点,每个所述单元节点包括至少两个单元子节点,每个所述单元子节点包括至少一个知识点;当所述第一节点为所述单元子节点、所述第二节点为所述知识点时,所述第一预测节点为预测单元子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题分类模型的训练方法,其特征在于,所述试题分类模型包括:第一分类层、第二分类层及映射层,所述方法包括:获取具有相同试题文本的第一试题样本及第二试题样本,所述第一试题样本携带第一标签,所述第二试题样本携带第二标签;其中,所述第一标签用于指示,在包括多个内容节点的教材体系中,所述试题文本归属的第一节点,所述第二标签用于指示所述试题文本归属的第二节点,所述第一节点与所述第二节点在所述教材体系中处于不同节点层级;通过所述第一分类层,基于所述第一试题样本进行分类预测,得到所述试题文本归属的第一预测节点,并通过所述第二分类层,基于所述第二试题样本进行分类预测,得到所述试题文本归属的第二预测节点;通过所述映射层,基于所述教材体系中节点间的关联关系,对所述第二预测节点进行映射,得到与所述第二预测节点对应的映射节点,所述映射节点与所述第一预测节点处于相同节点层级;结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点,更新所述试题分类模型的模型参数。2.如权利要求1所述的方法,其特征在于,所述第一分类层包括第一编码层及第一预测层,所述第二分类层包括第二编码层及第二预测层;其中,所述第一编码层与所述第二编码层共享模型参数;通过所述第一分类层,基于所述第一试题样本进行分类预测,得到所述试题文本归属的第一预测节点,包括:通过所述第一编码层,对所述第一试题样本进行向量编码,得到第一编码向量,并通过所述第一预测层,基于所述第一编码向量进行分类预测,得到所述试题文本归属的第一预测节点;所述通过所述第二分类层,基于所述第二试题样本进行分类预测,得到所述试题文本归属的第二预测节点,包括:通过所述第二编码层,对所述第二试题样本进行向量编码,得到第二编码向量,并通过所述第二预测层,基于所述第二编码向量进行分类预测,得到所述试题文本归属的第二预测节点。3.如权利要求2所述的方法,其特征在于,所述通过所述第一编码层,对所述第一试题样本进行向量编码,得到第一编码向量,包括:通过所述第一编码层,对所述第一试题样本进行分词处理得到多个样本词;分别对各个所述样本词进行编码,得到各所述样本词对应的词向量;对各所述样本词对应的词向量进行向量平均,得到所述第一编码向量。4.如权利要求2所述的方法,其特征在于,所述通过所述第一编码层,对所述第一试题样本进行向量编码,得到第一编码向量,包括:通过所述第一编码层,对所述第一试题样本进行关键词提取,得到多个关键词;分别对各个所述关键词进行编码,得到各所述关键词对应的关键词向量;获取各所述关键词对应的权重,并基于所述权重对各所述关键词对应的关键词向量进行加权求和,得到所述第一编码向量。
5.如权利要求1所述的方法,其特征在于,所述获取具有相同试题文本的第一试题样本及第二试题样本,包括:当所述试题文本对应目标试题时,获取所述目标试题的题干、答案及所述答案对应的解析内容;对所述目标试题的题干、答案及所述答案对应的解析内容进行拼接,得到所述试题文本;基于所述试题文本进行标签标注,得到携带所述第一标签的所述第一试题样本及携带所述第二标签的所述第二试题样本。6.如权利要求1所述的方法,其特征在于,所述结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点,更新所述试题分类模型的模型参数,包括:基于所述第一标签与所述第一预测节点,确定所述第一分类层对应的第一损失函数的值、基于所述第二标签与所述第二预测节点,确定所述第二分类层对应的第二损失函数的值、并基于所述第一标签与所述映射节点,确定所述映射层对应的第三损失函数的值;获取由所述第一损失函数、...

【专利技术属性】
技术研发人员:蔡晓凤叶礼伟杨晖刘萌孙朝旭卢鑫鑫吴嫒博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1