当前位置: 首页 > 专利查询>科大讯飞华南人工智能研究院广州有限公司专利>正文

题目批改方法、模型的训练方法、计算机设备及存储介质技术

技术编号：33041982 阅读：11 留言：0更新日期：2022-04-15 09:23

本申请实施例提供了一种题目批改方法、模型的训练方法、计算机设备及存储介质，批改方法包括：对题目文本、标准答案文本和学生作答文本进行编码，得到题目特征向量、标准答案特征向量和学生作答特征向量；对题目特征向量和标准答案特征向量进行对齐融合处理，得到第一融合向量；对题目特征向量和学生作答特征向量进行对齐融合处理，得到第二融合向量；将第一融合向量与第二融合向量进行对齐融合，得到第三融合向量；根据第三融合向量生成学生作答文本的批改结果；通过将学生作答文本的信息与标准答案文本的信息进行对齐融合，对齐融合的结果可以较好的指示哪些学生作答步骤需要与标准答案中的哪些步骤进行比较，从而提高题目批改的准确性。改的准确性。改的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
题目批改方法、模型的训练方法、计算机设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种题目批改方法、模型的训练方法、计算机设备及存储介质。

技术介绍

[0002]自然语言处理是人工智能和语言学领域的分支学科，主要研究使用计算机如何理解并处理人类自然语言的各种理论和方法。目前，自然语言处理技术已经被广泛应用到日常生活的各个方面，如：分本分类、语音识别、机器翻译等。其中，文本分类技术是将输入文本指定到预定义标签的过程，其中在不同任务中，需要指定的标签类别是不一样的；在题目批改任务中，需要模型根据题目和标准答案来判断学生作答是否正确或直接预测学生作答的批改得分，二者在模型侧的差别并不大。
[0003]现有的可以应用在题目批改任务的技术主要有文本分类技术。其中，文本分类任务是将输入文本指定到预定义标签的过程。该技术在当前任务场景中的目标是基于当前题目以及知识点的上下文中，判断输入的学生作答与标准答案的匹配程度，最终得出一个0到1的概率值，继而可以根据概率阈值分为两个类别：正确或错误；亦或直接将得到0到1的概率值表示该学生作答在该题中的归一化后的批改得分。但是现有的文本分类技术不能较好的适应题目批改任务，准确率较差。

技术实现思路

[0004]本申请实施例提供一种题目批改方法、模型的训练方法、计算机设备及存储介质，能够提高题目批改的准确性。
[0005]第一方面，本申请提供了一种题目批改方法，所述方法包括：
[0006]获取题目文本、标准答案文本和学生作答文本；
>[0007]对所述题目文本、标准答案文本和学生作答文本各自进行编码，得到题目特征向量、标准答案特征向量和学生作答特征向量；
[0008]对所述题目特征向量和所述标准答案特征向量进行对齐融合处理，得到第一融合向量；
[0009]对所述题目特征向量和所述学生作答特征向量进行对齐融合处理，得到第二融合向量；
[0010]将所述第一融合向量与所述第二融合向量进行对齐融合，得到第三融合向量；
[0011]根据所述第三融合向量生成所述学生作答文本的批改结果。
[0012]第二方面，本申请提供了一种题目批改模型的训练方法，包括：
[0013]获取题目文本、标准答案文本和学生作答文本，以及所述学生作答文本对应的标注的批改结果；
[0014]基于所述题目批改模型的编码模型，对所述题目文本、标准答案文本和学生作答文本各自进行编码，得到题目特征向量、标准答案特征向量和学生作答特征向量；
[0015]基于所述题目批改模型的自注意力机制模型，对所述题目特征向量和所述标准答案特征向量、所述学生作答特征向量进行对齐融合处理，得到第三融合向量；
[0016]基于所述题目批改模型的批改模型，根据所述第三融合向量生成所述学生作答文本的批改结果；
[0017]根据所述学生作答文本对应的生成的批改结果，和标注的批改结果，调整所述题目批改模型的模型参数。
[0018]第三方面，本申请提供了一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现上述的题目批改方法的步骤。
[0019]第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，若所述计算机程序被处理器执行，实现上述的题目批改方法的步骤。
[0020]本申请公开了一种题目批改方法、模型的训练方法、计算机设备及存储介质，其中批改方法包括：获取题目文本、标准答案文本和学生作答文本；对题目文本、标准答案文本和学生作答文本各自进行编码，得到题目特征向量、标准答案特征向量和学生作答特征向量；对题目特征向量和标准答案特征向量进行对齐融合处理，得到第一融合向量；对题目特征向量和学生作答特征向量进行对齐融合处理，得到第二融合向量；将第一融合向量与第二融合向量进行对齐融合，得到第三融合向量；根据第三融合向量生成学生作答文本的批改结果；通过将学生作答文本的信息与标准答案文本的信息进行对齐融合，对齐融合的结果可以较好的指示哪些学生作答步骤需要与标准答案中的哪些步骤进行比较，从而提高题目批改的准确性。
附图说明
[0021]为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0022]图1为本申请一实施例的题目批改方法的流程示意图；
[0023]图2为一实施方式中题目批改方法的应用场景的示意图；
[0024]图3为一实施方式中题目批改的示意图；
[0025]图4为本申请另一实施例的题目批改模型的训练方法的流程示意图；
[0026]图5为本申请一实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0027]下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。
[0028]附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。
[0029]本申请的实施例提供了一种题目批改方法、模型的训练方法、计算机设备及存储介质。以实现根据题目文本、标准答案文本和学生作答文本，确定学生作答文本的批改结果等过程，批改结果例如包括学生作答文本的得分。其中，本申请实施例主要以题目文本、标准答案文本和学生作答文本例如为计算题(如物理计算题)的文本为例进行说明，当然也可以不限于计算题。
[0030]题目批改任务相对于一般的自然语言处理任务，存在以下至少一项特点：1)文本中包含大量的公式和数值；2)批改任务不仅仅需要看文本字符串层面的相似度，需要更多的语义推理过程；3)在做批改任务时，需要结合大量的学科背景知识；4)在题目批改任务场景中，通常需要对比的两个文本(标准答案和学生作答)的信息量是不对等的，因为学生作答文本非常发散，如：有的学生在不会作答时会填写非常多的过程或公式，以希望获得一些过程分，而有些学生则直接少些或空着。
[0031]现有的可以应用在物理题目批改任务的技术主要有文本分类技术。文本分类技术主要可以分为以下三种方式：1)基于规则；2)基于统计学的传统分类算法；3)基于分布式表示的深度学习技术。其中，基于统计学的传统文本分类模型，有朴素贝叶斯(NB)、K近邻(KNN)、随机森林(RF)和支持向量机(SVM)等模型，这些统计模型相对与早期的规则模型，虽然在准确性和稳定性方面有显著的优势，但是仍然需要人工设计特征，极其耗费人力和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种题目批改方法，其特征在于，包括：获取题目文本、标准答案文本和学生作答文本；对所述题目文本、标准答案文本和学生作答文本各自进行编码，得到题目特征向量、标准答案特征向量和学生作答特征向量；对所述题目特征向量和所述标准答案特征向量进行对齐融合处理，得到第一融合向量；对所述题目特征向量和所述学生作答特征向量进行对齐融合处理，得到第二融合向量；将所述第一融合向量与所述第二融合向量进行对齐融合，得到第三融合向量；根据所述第三融合向量生成所述学生作答文本的批改结果。2.如权利要求1所述的题目批改方法，其特征在于，所述对所述题目文本进行编码，得到题目特征向量，包括：对所述题目文本中的每个词进行编码，得到词编码向量；基于预设的学科知识图谱，根据所述词编码向量，确定所述题目文本对应的题目特征向量。3.如权利要求1所述的题目批改方法，其特征在于，所述标准答案特征向量包括所述标准答案文本中各步骤的第一步骤向量，所述学生作答特征向量包括所述学生作答文本中各步骤的第二步骤向量。4.如权利要求1所述的题目批改方法，其特征在于，所述对所述题目特征向量和所述标准答案特征向量进行对齐融合处理，包括：将所述题目特征向量作为查询项，将所述标准答案特征向量作为键值对输入自注意力机制模型，得到第一融合向量；所述对所述题目特征向量和所述学生作答特征向量进行对齐融合处理，得到第二融合向量，包括：将所述题目特征向量作为查询项，将所述学生作答特征向量作为键值对输入自注意力机制模型，得到第二融合向量。5.如权利要求1
‑
4中任一项所述的题目批改方法，其特征在于，所述将所述第一融合向量与所述第二融合向量进行对齐融合，得到第三融合向量，包括：将所述第一融合向量作为查询项，将所述第二融合向量作为键值对输入自注意力机制模型，得到第三融合向量。6.如权利要求5所述的题目批改方法，其特征在于，所述自注意力机制模型对所述题目特征向量和所述标准答案特征向量进行对齐融合处理时，确定所述题目文本中若干知识点与所述标准答案文本中各步骤对应的第一注意力权重，及根据所述第一注意力权重对所述标准答案特征向量进行加权求和，得到所述第一融合向量；所述自注意力机制模型对所述题目特征向量和所述学生作答特征向量进行对齐融合处理时，确定所述题目文本中若干知识点与所述学生作答文本中各步骤对应的第二注意力权重，及根据所述第二注意力权重对所述学生作答特征向量进行加权求和，得到所述第二...

【专利技术属性】
技术研发人员：钟志成，王永康，
申请(专利权)人：科大讯飞华南人工智能研究院广州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人