试题分类模型的训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号：35095263 阅读：15 留言：0更新日期：2022-10-01 16:57

本申请提供了一种试题分类模型的训练方法、装置、设备、介质及产品，模型包括：第一分类层、第二分类层及映射层，方法包括：获取具有相同试题文本的、携带第一标签的第一试题样本及携带第二标签的第二试题样本；通过第一分类层，基于第一试题样本进行分类预测，得到试题文本归属的第一预测节点，并通过第二分类层，基于第二试题样本进行分类预测，得到试题文本归属的第二预测节点；通过映射层，基于教材体系中节点间的关联关系，对第二预测节点进行映射，得到与第二预测节点对应的映射节点；结合第一标签、第二标签、第一预测节点、第二预测节点及映射节点，更新试题分类模型的模型参数。如此，能够提高试题分类模型的训练效率及分类准确性。准确性。准确性。

全部详细技术资料下载

【技术实现步骤摘要】
试题分类模型的训练方法、装置、设备、介质及程序产品

[0001]本申请涉及人工智能技术，尤其涉及一种试题分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]教学中各科目的教材体系，往往包括章(单元)、节(课)、知识点等在教材体系中处于不同层级的节点，相关技术中，判断试题所对应的节点，如判断试题所归属的知识点，可以通过训练相应的分类模型来实现，然而相关技术中的模型训练方式往往通过构建携带相应节点标签的训练样本，基于构建的训练样本进行相应分类模型的训练，然而若要训练得到的分类模型达到一定准确度，采用该训练方式需要构建大量的训练样本，使得模型的训练效率低。

技术实现思路

[0003]本申请实施例提供一种试题分类模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够提高试题分类模型的训练效率以及分类准确性。
[0004]本申请实施例的技术方案是这样实现的：
[0005]本申请实施例提供一种试题分类模型的训练方法，所述试题分类模型包括：第一分类层、第二分类层及映射层，包括：
[0006]获取具有相同试题文本的第一试题样本及第二试题样本，所述第一试题样本携带第一标签，所述第二试题样本携带第二标签；
[0007]其中，所述第一标签用于指示，在包括多个内容节点的教材体系中，所述试题文本归属的第一节点，所述第二标签用于指示所述试题文本归属的第二节点，所述第一节点与所述第二节点在所述教材体系中处于不同节点层级；
[000...

【技术保护点】

【技术特征摘要】
1.一种试题分类模型的训练方法，其特征在于，所述试题分类模型包括：第一分类层、第二分类层及映射层，所述方法包括：获取具有相同试题文本的第一试题样本及第二试题样本，所述第一试题样本携带第一标签，所述第二试题样本携带第二标签；其中，所述第一标签用于指示，在包括多个内容节点的教材体系中，所述试题文本归属的第一节点，所述第二标签用于指示所述试题文本归属的第二节点，所述第一节点与所述第二节点在所述教材体系中处于不同节点层级；通过所述第一分类层，基于所述第一试题样本进行分类预测，得到所述试题文本归属的第一预测节点，并通过所述第二分类层，基于所述第二试题样本进行分类预测，得到所述试题文本归属的第二预测节点；通过所述映射层，基于所述教材体系中节点间的关联关系，对所述第二预测节点进行映射，得到与所述第二预测节点对应的映射节点，所述映射节点与所述第一预测节点处于相同节点层级；结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点，更新所述试题分类模型的模型参数。2.如权利要求1所述的方法，其特征在于，所述第一分类层包括第一编码层及第一预测层，所述第二分类层包括第二编码层及第二预测层；其中，所述第一编码层与所述第二编码层共享模型参数；通过所述第一分类层，基于所述第一试题样本进行分类预测，得到所述试题文本归属的第一预测节点，包括：通过所述第一编码层，对所述第一试题样本进行向量编码，得到第一编码向量，并通过所述第一预测层，基于所述第一编码向量进行分类预测，得到所述试题文本归属的第一预测节点；所述通过所述第二分类层，基于所述第二试题样本进行分类预测，得到所述试题文本归属的第二预测节点，包括：通过所述第二编码层，对所述第二试题样本进行向量编码，得到第二编码向量，并通过所述第二预测层，基于所述第二编码向量进行分类预测，得到所述试题文本归属的第二预测节点。3.如权利要求2所述的方法，其特征在于，所述通过所述第一编码层，对所述第一试题样本进行向量编码，得到第一编码向量，包括：通过所述第一编码层，对所述第一试题样本进行分词处理得到多个样本词；分别对各个所述样本词进行编码，得到各所述样本词对应的词向量；对各所述样本词对应的词向量进行向量平均，得到所述第一编码向量。4.如权利要求2所述的方法，其特征在于，所述通过所述第一编码层，对所述第一试题样本进行向量编码，得到第一编码向量，包括：通过所述第一编码层，对所述第一试题样本进行关键词提取，得到多个关键词；分别对各个所述关键词进行编码，得到各所述关键词对应的关键词向量；获取各所述关键词对应的权重，并基于所述权重对各所述关键词对应的关键词向量进行加权求和，得到所述第一编码向量。
5.如权利要求1所述的方法，其特征在于，所述获取具有相同试题文本的第一试题样本及第二试题样本，包括：当所述试题文本对应目标试题时，获取所述目标试题的题干、答案及所述答案对应的解析内容；对所述目标试题的题干、答案及所述答案对应的解析内容进行拼接，得到所述试题文本；基于所述试题文本进行标签标注，得到携带所述第一标签的所述第一试题样本及携带所述第二标签的所述第二试题样本。6.如权利要求1所述的方法，其特征在于，所述结合所述第一标签、所述第二标签、所述第一预测节点、所述第二预测节点及所述映射节点，更新所述试题分类模型的模型参数，包括：基于所述第一标签与所述第一预测节点，确定所述第一分类层对应的第一损失函数的值、基于所述第二标签与所述第二预测节点，确定所述第二分类层对应的第二损失函数的值、并基于所述第一标签与所述映射节点，确定所述映射层对应的第三损失函数的值；获取由所述第一损失函数、...

【专利技术属性】
技术研发人员：蔡晓凤，叶礼伟，杨晖，刘萌，孙朝旭，卢鑫鑫，吴嫒博，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人