作业批改方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33706850 阅读:21 留言:0更新日期:2022-06-06 08:31
本公开涉及一种作业批改方法、装置、存储介质及电子设备,方法包括:获取待批改作业对应的单题图像;对单题图像进行文本行识别,得到单题图像包括的各个文本行为作答文本行的第一概率;基于各个文本行在单题图像中的区域分布情况以及预设区域权重,对第一概率进行修正,得到各个文本行为作答文本行的第二概率,预设区域权重表征作答文本行在各个区域分布的可能性大小;对第二概率满足概率阈值的目标文本行进行文字识别,得到目标文本行对应的答题字符串;基于单题图像对应的答题字符串与单题图像对应的参考答案字符串之间的差异,生成单题图像的批改信息。本公开的方法可以提高作业批改的准确性。业批改的准确性。业批改的准确性。

【技术实现步骤摘要】
作业批改方法、装置、存储介质及电子设备


[0001]本公开涉及人工智能
,具体地,涉及一种作业批改方法、装置、存储介质及电子设备。

技术介绍

[0002]长期以来,学生作业都是老师手动进行批改,手动批改存在老师工作量大、批改结果不稳定且效率低的问题。近些年来,随着人工智能的迅速发展,逐渐出现了基于人工智能技术设计的作业自动批改的方法,以改善老师手动批改存在的问题。
[0003]然而,相关技术中的基于人工智能的作业批改的方法存在批改错误率高的问题,使得基于人工智能的作业批改方法还不足以广泛普及。

技术实现思路

[0004]本公开的目的是提供一种作业批改方法、装置、存储介质及电子设备,解决了作业批改时存在的批改错误率高的问题。
[0005]为了实现上述目的,第一方面,本公开提供一种作业批改方法,所述方法包括:
[0006]获取待批改作业对应的单题图像;
[0007]对所述单题图像进行文本行识别,得到所述单题图像包括的各个文本行为作答文本行的第一概率;
[0008]基于所述各个文本行在所述单题图像中的区域分布情况以及预设区域权重,对所述第一概率进行修正,得到所述各个文本行为作答文本行的第二概率,所述预设区域权重表征作答文本行在各个区域分布的可能性大小;
[0009]对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所述目标文本行对应的答题字符串;
[0010]基于所述单题图像对应的答题字符串与所述单题图像对应的参考答案字符串之间的差异,生成所述单题图像的批改信息。
[0011]可选地,所述对所述单题图像进行文本行识别,得到所述单题图像包括的各个文本行为作答文本行的第一概率,包括:
[0012]将所述单题图像输入预先训练好的文本行识别模型,得到所述文本行识别模型输出的第一识别结果,所述第一识别结果包括所述单题图像包括的各个文本行以及所述各个文本行为作答文本行的第一概率。
[0013]可选地,所述方法还包括:
[0014]获取由多个样本单题图像构成的第一样本数据集,每个样本单题图像包括作答区域分布标签;
[0015]基于所述第一样本数据集中各个样本单题图像包括的作答区域分布标签,确定所述预设区域权重。
[0016]可选地,所述对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所
述目标文本行对应的答题字符串,包括:
[0017]将所述目标文本行输入预先训练好的文字识别模型,得到所述文字识别模型输出的第二识别结果,所述第二识别结果包括所述目标文本行中的各个文本分别对应的各个预测字符以及所述各个预测字符对应的概率;
[0018]基于所述各个预测字符对应的概率,得到所述目标文本行对应的答题字符串。
[0019]可选地,所述基于所述各个预测字符对应的概率,得到所述目标文本行对应的答题字符串,包括:
[0020]基于字频权重关系对同一个文本对应的所述各个预测字符对应的概率进行修正,得到该文本对应的所述各个预测字符对应的目标概率,同一道题目包括的各个文本行中的各个文本共用一个字频权重关系,所述字频权重关系表征各个字符对应的加权权重;
[0021]获取目标概率最大的预测字符,作为该文本对应的目标字符;
[0022]基于所述目标文本行中的各个文本分别对应的目标字符,得到所述目标文本行对应的答题字符串。
[0023]可选地,所述方法还包括:
[0024]获取由同一个题目的多个样本单题图像构成的第二样本数据集;
[0025]基于所述第二样本数据集中各个字符出现的频率,确定该题目对应的字频权重关系。
[0026]可选地,所述预先训练好的文字识别模型通过以下步骤训练得到:
[0027]获取多个样本文本行,每个样本文本行对应一个真实字符串,所述真实字符串中的各个字符对应有损失权重,一个字符对应的损失权重表征所该字符被预测成其它字符的可能性大小;
[0028]将所述样本文本行输入待训练文字识别模型,得到所述待训练文字识别模型输出的预测字符串;
[0029]基于所述预测字符串以及所述真实字符串之间的差异,得到各个字符对应的第一损失;
[0030]基于所述损失权重,对对应字符的第一损失进行加权求和,得到总损失;
[0031]基于所述总损失,对所述待训练文字识别模型进行反向传播,以完成对所述待训练文字识别模型的一次训练,所述待训练文字识别模型在经过多次训练后,得到所述预先训练好的文字识别模型。
[0032]可选地,所述获取待批改作业对应的单题图像,包括:
[0033]对所述待批改作业的图像进行特征点识别,得到第一特征信息;
[0034]基于各个候选标准作业图像的第二特征信息与所述第一特征信息之间的匹配度,确定目标标准作业图像;
[0035]基于所述第一特征信息以及所述目标标准作业图像对应的第二特征信息,对所述待批改作业的图像进行图像矫正,得到矫正后的图像;
[0036]对所述矫正后的图像进行题目分割,得到所述待批改作业对应的单题图像。
[0037]第二方面,本公开还提供一种作业批改装置,所述装置包括:
[0038]获取模块,用于获取待批改作业对应的单题图像;
[0039]文本行识别模块,用于对所述单题图像进行文本行识别,得到所述单题图像包括
的各个文本行为作答文本行的第一概率;
[0040]修正模块,用于基于所述各个文本行在所述单题图像中的区域分布情况以及预设区域权重,对所述第一概率进行修正,得到所述各个文本行为作答文本行的第二概率,所述预设区域权重表征作答文本行在各个区域分布的可能性大小;
[0041]文字识别模块,用于对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所述目标文本行对应的答题字符串;
[0042]批改模块,用于基于所述单题图像对应的答题字符串与所述单题图像对应的参考答案字符串之间的差异,生成所述单题图像的批改信息。
[0043]第三方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中方法的步骤。
[0044]第四方面,本公开还提供了一种电子设备,包括:
[0045]存储器,其上存储有计算机程序;
[0046]处理器,用于执行存储器中的计算机程序,以实现第一方面中方法的步骤。
[0047]通过上述技术方案,先获取待批改作业对应的单题图像,然后对所述单题图像进行文本行识别,得到所述单题图像包括的各个文本行为作答文本行的第一概率,再基于所述各个文本行在所述单题图像中的区域分布情况以及预设区域权重,对所述第一概率进行修正,得到所述各个文本行为作答文本行的第二概率,再对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所述目标文本行对应的答题字符串,最后基于所述单题图像对应的答题字符串与所述单题图像对应的参考答案字符串之间的差异,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种作业批改方法,其特征在于,包括:获取待批改作业对应的单题图像;对所述单题图像进行文本行识别,得到所述单题图像包括的各个文本行为作答文本行的第一概率;基于所述各个文本行在所述单题图像中的区域分布情况以及预设区域权重,对所述第一概率进行修正,得到所述各个文本行为作答文本行的第二概率,所述预设区域权重表征作答文本行在各个区域分布的可能性大小;对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所述目标文本行对应的答题字符串;基于所述单题图像对应的答题字符串与所述单题图像对应的参考答案字符串之间的差异,生成所述单题图像的批改信息。2.根据权利要求1所述的作业批改方法,其特征在于,所述对所述单题图像进行文本行识别,得到所述单题图像包括的各个文本行为作答文本行的第一概率,包括:将所述单题图像输入预先训练好的文本行识别模型,得到所述文本行识别模型输出的第一识别结果,所述第一识别结果包括所述单题图像包括的各个文本行以及所述各个文本行为作答文本行的第一概率。3.根据权利要求1所述的作业批改方法,其特征在于,所述方法还包括:获取由多个样本单题图像构成的第一样本数据集,每个样本单题图像包括作答区域分布标签;基于所述第一样本数据集中各个样本单题图像包括的作答区域分布标签,确定所述预设区域权重。4.根据权利要求1

3任一项所述的作业批改方法,其特征在于,所述对所述第二概率满足概率阈值的目标文本行进行文字识别,得到所述目标文本行对应的答题字符串,包括:将所述目标文本行输入预先训练好的文字识别模型,得到所述文字识别模型输出的第二识别结果,所述第二识别结果包括所述目标文本行中的各个文本分别对应的各个预测字符以及所述各个预测字符对应的概率;基于所述各个预测字符对应的概率,得到所述目标文本行对应的答题字符串。5.根据权利要求4所述的作业批改方法,其特征在于,所述基于所述各个预测字符对应的概率,得到所述目标文本行对应的答题字符串,包括:基于字频权重关系对同一个文本对应的所述各个预测字符对应的概率进行修正,得到该文本对应的所述各个预测字符对应的目标概率,同一道题目包括的各个文本行中的各个文本共用一个字频权重关系,所述字频权重关系表征各个字符对应的加权权重;获取目标概率最大的预测字符,作为该文本对应的目标字符;基于所述目标文本行中的各个文本分别对应的目标字符,得到所述目标文本行对应的答题字符串。6.根据权利要求5所述的作业批改方法,其特征在于,所述方法还包括:获取由同一个题目的多个样本单题图像构成的第二样本数据集;基于所述第二...

【专利技术属性】
技术研发人员:郝双尹成浩王少康刘腾龙杨明坤张飞飞马志国陶俊杰张建鑫
申请(专利权)人:北京开拓鸿业高科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1