图像识别方法、答题批改方法及相关装置、设备和介质制造方法及图纸

技术编号:34946276 阅读:23 留言:0更新日期:2022-09-17 12:22
本申请公开了一种图像识别方法、答题批改方法及相关装置、设备和介质,其中,图像识别方法包括:对答题图像进行检测,得到若干目标区域;其中,若干目标区域至少包括第一题干区域;对第一题干区域进行重组,得到各个试题的第二题干区域;其中,第二题干区域包含第二题干区域所属试题完整的题干文本;再基于第二题干区域进行识别,得到各题干文本。上述方案,能够提高获取题干文本的准确性。高获取题干文本的准确性。高获取题干文本的准确性。

【技术实现步骤摘要】
图像识别方法、答题批改方法及相关装置、设备和介质


[0001]本申请涉及图像处理
,特别是涉及一种图像识别方法、答题批改方法及相关装置、设备和介质。

技术介绍

[0002]目前,在检测试题时,通常需要在现场进行。例如,在对学生的笔试试卷评估场景中,需要老师对学生的答题试卷进行批改,并且得出最终的结果;在公司对员工的笔试场景中,需要经过对员工的笔试试卷进行批改,才能得出最终结论,如此种种。
[0003]试题检测结果的评估一般是采用人工检阅的方式进行梳理,效率较低,且随着人工检阅时长的不断增加,难免会因疲劳等因素导致检阅失误。故此,如何进行机器检阅越来越受到关注。然而,机器检阅的重要前提之一就是准确识别出题干文本。有鉴于此,如何提高获取题干文本的准确性成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种图像识别方法、答题批改方法及相关装置、设备和介质,能够提高获取题干文本的准确性。
[0005]为了解决上述技术问题,本申请第一方面提供了一种图像识别方法,包括:对答题图像进行检测,得到若干目标区域;且若干目标区域包括各试题的第一题干区域和题号区域;基于题号区域的位置关系,对第一题干区域进行重组,得到各个试题的第二题干区域;且第二题干区域包含试题完整的题干文本;再基于第二题干区域进行识别,得到各题干文本。
[0006]为了解决上述技术问题,本申请第二方面提供了一种答题批改方法,包括:识别目标对象的答题图像中各试题的题干文本;且题干文本基于上述第一方面中的图像识别方法得到;获取属于相同试题的各个题干文本分别对应的批改区域;再基于批改区域中的批改标记,得到目标对象在各个试题上的作答情况。
[0007]为了解决上述技术问题,本申请第三方面提供了一种图像识别装置,包括检测模块、重组模块和识别模块,检测模块用于对答题图像进行检测,得到若干目标区域;且若干目标区域包括各试题的第一题干区域和题号区域;重组模块用于基于题号区域的位置关系,对第一题干区域进行重组,得到各个试题的第二题干区域;且第二题干区域包含试题完整的题干文本;识别模块用于基于第二题干区域进行识别,得到各题干文本。
[0008]为了解决上述技术问题,本申请第四方面提供了一种答题批改装置,包括识别模块、获取模块和确定模块;识别模块用于识别目标对象的答题图像中各试题的题干文本;且题干文本基于上述第一方面中的图像识别方法得到;获取模块用于获取属于相同试题的各个题干文本分别对应的批改区域;确定模块用于基于批改区域中的批改标记,得到目标对象在各个试题上的作答情况。
[0009]为了解决上述技术问题,本申请第五方面提供了一种电子设备,包括相互耦接的
存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的图像识别方法或实现上述第二方面中的答题批改方法。
[0010]为了解决上述技术问题,本申请第六方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的图像识别方法或实现上述第二方面中的答题批改方法。
[0011]上述方案,通过对答题图像进行检测,得到若干目标区域;且若干目标区域至少包括第一题干区域;并对第一题干区域进行重组,得到各个试题的第二题干区域;其中,第二题干区域包含第二题干区域所属试题完整的题干文本;再基于第二题干区域进行识别,得到各题干文本,一方面由于对题干区域进行重组,有助于更加便利地对题干区域进行识别,另一方面由于重组后的第二题干区域包含试题完整的题干文本。故此,能够提高获取题干文本的准确性。
附图说明
[0012]图1是本申请图像识别方法一实施例的流程示意图;
[0013]图2是答题图像一实施例的示意图;
[0014]图3是图1中步骤S12一实施例的流程示意图;
[0015]图4是题干文本一实施例的示意图;
[0016]图5是本申请答题批改方法一实施例的流程示意图;
[0017]图6是本申请图像识别模型一实施例的网络结构示意图;
[0018]图7是本申请图像识别模型一实施例的编解码器架构示意图;
[0019]图8是本申请图像识别装置一实施例的框架示意图;
[0020]图9是本申请答题批改装置一实施例的框架示意图;
[0021]图10是本申请电子设备一实施例的框架示意图;
[0022]图11是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0023]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0024]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0025]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0026]请参阅图1,图1是本申请图像识别方法一实施例的流程示意图。
[0027]具体而言,可以包括如下步骤:
[0028]步骤S11:对答题图像进行检测,得到若干目标区域。
[0029]在一个实施场景中,对答题图像进行检测之前,可以根据答题内容获取答题图像,示例性地,可以对答题内容进行拍照,获取答题图像,还可以对答题内容进行扫描,获取答题图像,获取答题图像的方式可以根据实际情况进行选择,在此不做具体限定。
[0030]在一个具体实施场景中,答题内容可以根据预设规则进行批改,预设规则可以根据事情情况进行选择,示例性地,答题对象为学生,预设规则可以包括不同的批改规则,具体如:“√”表示正确的;“O”、
“×”
表示全错;“?”表示有疑问,需进行纠正;“乄”表示部分错误,需进行纠正;
“☆”
表示较好的。学生在作答完作业(试卷、教辅书)等,可以由学生(老师、家长)按照约定的批改规则进行批改。但是在实际的批改过程中,可能会存在不确定因素,如在页面的打分区域,出现约定之外的批改符号等,因此,答题内容中可以根据预设规则进行标记,以此区分不同答题区域,示例性地,可以将出现的红笔分数标记为“dignum”;题干区域可以标记为“prtarea”;题号区域可以标记为“quenum”,其他出现的手写符号全部标记为“other”类别。对答题内容的预设批改规则可以根据实际情况进行设置,在此不做具体限定。
[0031]请参阅图2,图2是答题图像一实施例的示意图,如图2所述,图中的目标区域的表示方式为矩形,目标区域还可以表示为圆形,目标区域的表示方式可以根据实际情况进行设置,在此不做具体限定。
[0032]在一个实施场景中,在对答题图像进行检测,并得到若干目标区域之前,还本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:对答题图像进行检测,得到若干目标区域;其中,所述若干目标区域至少包括第一题干区域;对所述第一题干区域进行重组,得到各个试题的第二题干区域;其中,所述第二题干区域包含所述第二题干区域所属试题完整的题干文本;基于所述第二题干区域进行识别,得到各题干文本。2.根据权利要求1所述的方法,其特征在于,所述若干目标区域还包括题干区域;所述对所述第一题干区域进行重组,得到各个试题的第二题干区域,包括:获取题号区域内所含题号的题号类别;基于所述第一题干区域和所述题号类别重组得到各个所述试题的第二题干区域。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一题干区域和所述题号类别重组得到各个所述试题的第二题干区域,包括:获取各所述题号分别对应的第一题干区域,并基于所述题号的题号类别,确定所述题号之间的位置关系;其中,所述位置关系包括所述题号之间是否存在嵌套关系,且在所述题号之间存在所述嵌套关系的情况下,所述题号属于同一所述试题;响应于所述题号之间存在嵌套关系且所述题号分别对应的第一题干区域跨区域显示,将所述题号分别对应的第一题干区域进行拼接,得到所述题号所属试题的第二题干区域。4.根据权利要求1所述的方法,其特征在于,对所述第一题干区域进行重组,得到各个所述试题的第二题干区域之后,以及在所述基于所述第二题干区域进行识别,得到各题干文本之前,所述方法还包括:对所述第二题干区域进行文本行检测,得到所述第二题干区域中若干文本行区域;基于所述第二题干区域中各所述文本行区域的轮廓点,对所述第二题干区域中所述文本行区域进行重组,得到新的第二题干区域。5.根据权利要求4所述的方法,其特征在于,所述基于所述第二题干区域中各所述文本行区域的轮廓点,对所述第二题干区域中所述文本行区域进行重组,得到新的第二题干区域,包括:基于所述第二题干区域中各所述文本行区域的轮廓点,获取表征各所述文本行区域之间相对倾斜关系的第一角度值;基于所述第一角度值满足第一条件,对所述文本行区域进行拼接,得到所述新的第二题干区域。6.根据权利要求5所述的方法,其特征在于,在所述基于所述第二题干区域中各所述文本行区域的轮廓点,获取表征各所述文本行区域之间相对倾斜关系的第一角度值之前,所述方法还包括:基于各所述文本行区域的轮廓点,检测得到各文本行区域之间的重合度;响应于所述文本行区域之间的重合度满足第二条件,对所述文本行区域进行排列,得到新的文本行区域。7.根据权利要求5所述的方法,其特征在于,所述获取表征各所述文本行区域之间相对倾斜关系的第一角度值,包括:获取分别表征所述文本行...

【专利技术属性】
技术研发人员:王根
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1