一种评阅方法、装置、计算机设备及存储装置制造方法及图纸

技术编号:27205780 阅读:13 留言:0更新日期:2021-01-31 12:28
本公开提供了一种评阅方法、装置、计算机设备及存储介质,该方法包括:获取待评阅答案信息和参考答案信息;基于训练好的神经网络模型、所述待评阅答案信息和参考答案信息,确定用于表征待评阅答案和参考答案之间的语义关联关系的第一特征矩阵;基于所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的统计特征关系的第二特征矩阵;基于所述第一特征矩阵、所述第二特征矩阵以及预先训练的特征提取矩阵,确定所述待评阅答案信息对应的评阅结果。基于这种方法,可以结合语义特征和统计特征对待评阅答案信息进行评估,提高了评阅结果的准确率。提高了评阅结果的准确率。提高了评阅结果的准确率。

【技术实现步骤摘要】
一种评阅方法、装置、计算机设备及存储装置


[0001]本公开涉及计算机
,具体而言,涉及一种评阅方法、装置、计算机设备及存储介质。

技术介绍

[0002]学生题目一般分为主观题和客观题,客观题可以包括计算题、选择题等,在对客观题进行评阅时,由于客观题的答案是确定的,因此客观题在评阅时仅需判断学生答案与标准答案是否一致即可;而对于主观题,由于没有绝对标准的答案,因此需要人工去逐一评阅。
[0003]然而人工在评阅过程中,可能会携带有用户的主观意识,不同人对于同一主观题的评阅结果可能不同,因此造成主观题评阅的准确率和效率都比较低。

技术实现思路

[0004]本公开实施例至少提供一种评阅方法、装置、计算机设备及存储介质。
[0005]第一方面,本公开实施例提供了一种评阅方法,包括:
[0006]获取待评阅答案信息和参考答案信息;
[0007]基于训练好的神经网络模型、所述待评阅答案信息和参考答案信息,确定用于表征待评阅答案和参考答案之间的语义关联关系的第一特征矩阵;
[0008]基于所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的统计特征关系的第二特征矩阵;
[0009]基于所述第一特征矩阵、所述第二特征矩阵以及预先训练的特征提取矩阵,确定所述待评阅答案信息对应的评阅结果。
[0010]一种可能的实施方式中,所述基于训练好的神经网络模型、所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的语义关联关系的第一特征矩阵,包括:
[0011]将所述待评阅答案信息和所述参考答案信息进行预处理,得到用于表征所述待评阅答案信息和所述参考答案信息的表征矩阵;
[0012]将所述表征矩阵输入至所述神经网络模型,得到所述第一特征矩阵。
[0013]一种可能的实施方式中,所述将所述待评阅答案信息和所述参考答案信息进行预处理,得到用于表征所述待评阅答案信息和所述参考答案信息的表征矩阵,包括:
[0014]对所述待评阅答案信息进行分词处理,得到所述待评阅答案对应的至少一个第一待筛选关键词,以及将所述参考答案信息进行分词处理,得到所述参考答案信息对应的至少一个第二待筛选关键词;
[0015]基于停用词库中存储的多个停用词,从所述第一待筛选关键词和所述第二待筛选关键词中确定目标关键字;
[0016]确定每个目标关键字对应的字向量,并根据所述目标关键字在所述待评阅答案信
息和所述参考答案信息中出现的先后顺序,确定所述表征矩阵。
[0017]一种可能的实施方式中,所述确定每个目标关键字对应的字向量,包括:
[0018]基于预先设置的存储有关键字和字向量对应关系的关键字字典,查找每个目标关键字对应的字向量。
[0019]一种可能的实施方式中,所述基于停用词库中存储的多个停用词,从所述第一待筛选关键词和所述第二待筛选关键词中确定目标关键字,包括:
[0020]将分别将所述第一待筛选关键词和所述第二待筛选关键词与停用词库中存储的多个停用词进行匹配,确定匹配不成功的待筛选关键词;
[0021]在所述匹配不成功的待筛选关键词所包含的关键字的个数超过预设个数的情况下,基于所述匹配不成功的待筛选关键词在所述待评阅答案信息中出现的先后顺序,将所述待筛选关键词中所包含的前N个关键字作为所述目标关键字,其中,N为所述预设个数,且N为正整数。
[0022]一种可能的实施方式中,所述确定每个目标关键字对应的字向量,并根据所述目标关键字在所述待评阅答案信息和所述参考答案信息中出现的先后顺序,确定所述表征矩阵,包括:
[0023]确定标记符对应的字向量;
[0024]将属于所述待评阅答案信息的目标关键字对应的字向量,按照所述目标关键字在所述待评阅答案信息中出现的先后顺序进行拼接,得到第一拼接矩阵;以及将属于参考答案信息的目标关键字对应的字向量,按照所述目标关键字在所述参考答案信息中出现的先后顺序进行拼接,得到第二拼接矩阵;
[0025]将所述标记符对应的字向量、所述第一拼接矩阵以及所述第二拼接矩阵进行拼接,得到所述表征矩阵,所述标记符用于区分所述第一拼接矩阵和所述第二拼接矩阵。
[0026]一种可能的实施方式中,所述基于所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的统计特征关系的第二特征矩阵,包括:
[0027]基于所述待评阅答案信息和所述参考答案信息,确定所述待评阅信息和所述参考答案信息之间的统计特征信息;
[0028]基于所述待评阅信息和所述参考答案信息之间的统计特征信息,确定所述第二特征矩阵。
[0029]一种可能的实施方式中,所述统计特征信息包括以下信息中的多种:
[0030]所述待评阅信息和所述参考答案信息之间的编辑距离、所述待评阅信息和所述参考答案信息中相同词的个数和不同词的个数、词集合相似度、N元模型N-gram相似度、所述待评阅信息和所述参考答案信息的文本长度差别。
[0031]一种可能的实施方式中,所述待评阅答案信息对应的评阅结果包括所述待评阅答案信息和所述参考答案信息之间的相似度分数;
[0032]所述基于所述第一特征矩阵、所述第二特征矩阵以及预先训练的特征提取矩阵,确定所述待评阅答案信息对应的评阅结果,包括:
[0033]将所述第一特征矩阵和第二特征矩阵进行纵向拼接,得到全特征矩阵;
[0034]基于特征提取矩阵对所述全特征矩阵进行特征提取,得到相似度矩阵;
[0035]基于所述相似度矩阵和激活函数,生成所述待评阅答案和参考答案的相似度分
数。
[0036]一种可能的实施方式中,所述方法还包括根据以下方法训练所述神经网络模型:
[0037]获取所述待评阅样本答案信息、所述待评阅样本答案信息对应的样本参考答案信息,以及所述待评阅样本答案信息的标注信息,其中,所述标注信息用于表示所述待评阅样本答案信息的正确性;
[0038]基于所述待评阅样本答案信息、所述样本参考答案信息以及待训练的神经网络模型,确定第一样本特征矩阵;
[0039]基于所述待评阅样本答案信息和所述样本参考答案信息之间的统计特征信息,确定第二样本特征矩阵;
[0040]基于所述第一样本特征矩阵、所述第二样本特征矩阵以及待训练的特征提取矩阵,确定所述待评阅答案和参考答案的相似度矩阵;
[0041]基于所述标注信息和相似度矩阵,确定本次训练过程中的损失值,在所述损失值大于设定阈值的情况下,调整所述神经网络模型的模型参数,以及所述特征提取矩阵,并重新对所述神经网络模型进行训练。
[0042]第二方面,本公开实施例还提供一种评阅装置,包括:
[0043]获取模块,用于获取待评阅答案信息和参考答案信息;
[0044]第一确定模块,用于基于训练好的神经网络模型、所述待评阅答案信息和参考答案信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评阅方法,其特征在于,包括:获取待评阅答案信息和参考答案信息;基于训练好的神经网络模型、所述待评阅答案信息和参考答案信息,确定用于表征待评阅答案和参考答案之间的语义关联关系的第一特征矩阵;基于所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的统计特征关系的第二特征矩阵;基于所述第一特征矩阵、所述第二特征矩阵以及预先训练的特征提取矩阵,确定所述待评阅答案信息对应的评阅结果。2.根据权利要求1所述的方法,其特征在于,所述基于训练好的神经网络模型、所述待评阅答案信息和参考答案信息,确定用于表征所述待评阅答案和所述参考答案之间的语义关联关系的第一特征矩阵,包括:将所述待评阅答案信息和所述参考答案信息进行预处理,得到用于表征所述待评阅答案信息和所述参考答案信息的表征矩阵;将所述表征矩阵输入至所述神经网络模型,得到所述第一特征矩阵。3.根据权利要求2所述的方法,其特征在于,所述将所述待评阅答案信息和所述参考答案信息进行预处理,得到用于表征所述待评阅答案信息和所述参考答案信息的表征矩阵,包括:对所述待评阅答案信息进行分词处理,得到所述待评阅答案对应的至少一个第一待筛选关键词,以及将所述参考答案信息进行分词处理,得到所述参考答案信息对应的至少一个第二待筛选关键词;基于停用词库中存储的多个停用词,从所述第一待筛选关键词和所述第二待筛选关键词中确定目标关键字;确定每个目标关键字对应的字向量,并根据所述目标关键字在所述待评阅答案信息和所述参考答案信息中出现的先后顺序,确定所述表征矩阵。4.根据权利要求3所述的方法,其特征在于,所述确定每个目标关键字对应的字向量,包括:基于预先设置的存储有关键字和字向量对应关系的关键字字典,查找每个目标关键字对应的字向量。5.根据权利要求3所述的方法,其特征在于,所述基于停用词库中存储的多个停用词,从所述第一待筛选关键词和所述第二待筛选关键词中确定目标关键字,包括:将分别将所述第一待筛选关键词和所述第二待筛选关键词与停用词库中存储的多个停用词进行匹配,确定匹配不成功的待筛选关键词;在所述匹配不成功的待筛选关键词所包含的关键字的个数超过预设个数的情况下,基于所述匹配不成功的待筛选关键词在所述待评阅答案信息中出现的先后顺序,将所述待筛选关键词中所包含的前N个关键字作为所述目标关键字,其中,N为所述预设个数,且N为正整数。6.根据权利要求3所述的方法,其特征在于,所述确定每个目标关键字对应的字向量,并根据所述目标关键字在所述待评阅答案信息和所述参考答案信息中出现的先后顺序,确定所述表征矩阵,包括:
确定标记符对应的字向量;将属于所述待评阅答案信息的目标关键字对应的字向量,按照所述目标关键字在所述待评阅答案信息中出现的先后顺序进行拼接,得到第一拼接矩阵;以及将属于参考答案信息的目标关键字对应的字向量,按照所述目标关键字在所述参考答案信息中出现的先后顺序进行拼接,得到第二拼接矩阵;将所述标记符对应的字向量、所述第一拼接矩阵以及所述第二拼接矩阵进行拼接,得到所述表征矩阵,所述标记符用于区分所述第一拼接矩阵和所述第二拼接矩阵。7.根据权利要求1所述的方法,其特征在于,所述基于所述待评阅答案信息...

【专利技术属性】
技术研发人员:李雪冬
申请(专利权)人:北京乐学帮网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1