一种小题识别方法、装置及介质制造方法及图纸

技术编号:33634048 阅读:13 留言:0更新日期:2022-06-02 01:43
本发明专利技术提供了一种基于机器学习的小题识别方法,其通过机器学习的方式识别出试卷中的所有试题区域以及批改痕迹,并进一步的对所述试题是否存在小题进行识别,并根据是否存在小题以及批改痕迹进一步确定每一个小题以及答题的批改结果,可以更准确的识别试卷的批改结果。果。果。

【技术实现步骤摘要】
一种小题识别方法、装置及介质


[0001]本专利技术涉及教育
,具体来说,涉及一种小题识别方法、装置及介质。

技术介绍

[0002]当前智慧课堂快速发展,试卷、教辅等统分功能已经出现,但是对于试卷及教辅等的批改功能还有待完善,目前的识别系统基本只能做到大题识别,但是大题识别不利于教师统分也不利于后续的根据精细化知识点推荐题目。
[0003]小题识别主要面临如下问题:1)教师习惯对一个大题中所有做对或做错的题目只进行一个批改符号的批改,如对一个大题中的几个小题,只画一个勾或叉表示所有小题为正确或错误。2)一个大题对应的小题可能有对也有错,教师也可能分别对每个小题进行单独批改。3)小题分布可能为纵向,也可能为横向,在一个批改痕迹的情况下,不利于准确的获取小题信息。
[0004]本文提供的背景描述用于总体上呈现本公开的上下文的目的。除非本文另外指示,在该章节中描述的资料不是该申请的权利要求的现有技术并且不要通过包括在该章节内来承认其成为现有技术。

技术实现思路

[0005]针对相关技术中的上述技术问题,本专利技术提出一种基于机器学习的小题识别方法,其包括如下步骤:
[0006]S1、获取待识别目标的模板数据,根据所述模板数据对所述待识别目标进行图像分割,依次对分割的图像进行批改痕迹提取;并使用预设的识别模型识别所述批改痕迹的结果;
[0007]S2、获取所述分割图像内的有效批改痕迹个数,若有效批改痕迹个数为一个,则该分割图像的批改结果为所述批改痕迹的识别结果;
[0008]S3、若所述批改痕迹个数不为一个,则进一步获取所有批改痕迹中,批改痕迹所占区域最大的痕迹,将该批改痕迹识别的结果做为该题默认的批改结果,记为默认值;
[0009]S4、获取该分割区域各个小题对应的区域,若不存在小题,则判断该题范围内,是否存在结果为错误的批改痕迹,若存在错误的批改痕迹,则该题整体的批改结果为错误;
[0010]S5、若存在小题则依次遍历所有小题对应的区域,判断该小题范围内是否存在批改痕迹。若存在批改痕迹,则以该该批痕迹的结果做为该小题的识别结果,若不存在批改痕迹,则采用默认值为批改结果。
[0011]具体的,步骤S3中批改痕迹默认值判断方法可进一步对最大的批改痕迹进行二次校验,所述二次校验步骤进一步包括:
[0012]S31、判断判断该题是否存在小题,不存在小题,则无需二次校验,若存在小题,则进一步识别小题的分布方式;
[0013]S32、若小题为纵向分布,则进一步计算该最大批改痕迹的纵向上所占高度为该题
整体纵向上高度的比例值,若该比例值超过预设阈值,则可将该最大批改痕迹的结果做为默认值;
[0014]S33、若小题为横向分布,则进一步计算该最大批改痕迹的横向上所占长度为该题整体横向上长度的比例值,若该比例值超过预设阈值,则可将该最大批改痕迹的结果做为默认值;
[0015]S34、若小题为纵横分布,则进一步可以根据纵向高度与横向长度的大小或比例关系,判断该题整体更偏向于纵向分布还是横向分布,再根据该整体偏向的分布结构进行识别。
[0016]具体的,步骤S5中的批改痕迹进行二次校验,当且仅当批改痕迹再小题区域所占比例大于预设阈值时,该批改痕迹才认为为有效批改痕迹。
[0017]具体的,所述模板数据包括页面数据及题目数据。
[0018]具体的,所述页面数据包括页面的宽高数据或/和页码;所述题目数据包括题目的坐标数据。
[0019]第二方面,本专利技术的另一个实施例公开了一种机器学习的小题识别装置,其包括如下单元:
[0020]批改痕迹识别单元、用于获取待识别目标的模板数据,根据所述模板数据对所述待识别目标进行图像分割,依次对分割的图像进行批改痕迹提取;并使用预设的识别模型识别所述批改痕迹的结果;
[0021]有效批改痕迹判断单元、用于获取所述分割图像内的有效批改痕迹个数,若有效批改痕迹个数为一个,则该分割图像的批改结果为所述批改痕迹的识别结果;
[0022]最大批改痕迹判断单元,用于若所述批改痕迹个数不为一个,则进一步获取所有批改痕迹中,批改痕迹所占区域最大的痕迹,将该批改痕迹识别的结果做为该题默认的批改结果,记为默认值;
[0023]小题判断单元、用于获取该分割区域各个小题对应的区域,若不存在小题,则判断该题范围内,是否存在结果为错误的批改痕迹,若存在错误的批改痕迹,则该题整体的批改结果为错误;
[0024]批改结果确定单元、用于若存在小题则依次遍历所有小题对应的区域,判断该小题范围内是否存在批改痕迹;若存在批改痕迹,则以该该批痕迹的结果做为该小题的识别结果,若不存在批改痕迹,则采用默认值为批改结果。
[0025]具体的,最大痕迹判断单元进一步包括:
[0026]二次校验单元:所述最大痕迹判断单元中的批改痕迹默认值判断方法可进一步使用二次校验单元对最大的批改痕迹进行二次校验,所述二次校验单元进一步包括:
[0027]第二小题判断单元、用于判断判断该题是否存在小题,不存在小题,则无需二次校验,若存在小题,则进一步识别小题的分布方式;
[0028]第一小题方向处理单元、用于若小题为纵向分布,则进一步计算该最大批改痕迹的纵向上所占高度为该题整体纵向上高度的比例值,若该比例值超过预设阈值,则可将该最大批改痕迹的结果做为默认值;
[0029]第二小题方向处理单元、用于若小题为横向分布,则进一步计算该最大批改痕迹的横向上所占长度为该题整体横向上长度的比例值,若该比例值超过预设阈值,则可将该
最大批改痕迹的结果做为默认值;
[0030]第三小题方向处理单元、用于若小题为纵横分布,则进一步可以根据纵向高度与横向长度的大小或比例关系,判断该题整体更偏向于纵向分布还是横向分布,再根据该整体偏向的分布结构进行识别。
[0031]具体的,小题判断单元中的批改痕迹进行二次校验,当且仅当批改痕迹再小题区域所占比例大于预设阈值时,该批改痕迹才认为为有效批改痕迹。
[0032]具体的,所述模板数据包括页面数据及题目数据;所述页面数据包括页面的宽高数据或/和页码;所述题目数据包括题目的坐标数据。
[0033]第三方面,本专利技术的另一实施例公开了一种非易失性存储器,所述非易失性存储器存储有指令,所述指令在被处理器执行时,用于实现上述的基于机器学习的小题识别方法。
[0034]本专利技术通过机器学习的方式识别出试卷中的所有试题区域以及批改痕迹,并进一步的对所述试题是否存在小题进行识别,并根据是否存在小题以及批改痕迹进一步确定每一个小题以及答题的批改结果,可以更准确的识别试卷的批改结果。
附图说明
[0035]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的小题识别方法,其包括如下步骤:S1、获取待识别目标的模板数据,根据所述模板数据对所述待识别目标进行图像分割,依次对分割的图像进行批改痕迹提取;并使用预设的识别模型识别所述批改痕迹的结果;S2、获取所述分割图像内的有效批改痕迹个数,若有效批改痕迹个数为一个,则该分割图像的批改结果为所述批改痕迹的识别结果;S3、若所述批改痕迹个数不为一个,则进一步获取所有批改痕迹中,批改痕迹所占区域最大的痕迹,将该批改痕迹识别的结果做为该题默认的批改结果,记为默认值;S4、获取该分割区域各个小题对应的区域,若不存在小题,则判断该题范围内,是否存在结果为错误的批改痕迹,若存在错误的批改痕迹,则该题整体的批改结果为错误;S5、若存在小题则依次遍历所有小题对应的区域,判断该小题范围内是否存在批改痕迹;若存在批改痕迹,则以该该批痕迹的结果做为该小题的识别结果,若不存在批改痕迹,则采用默认值为批改结果。2.根据权利要求1所述的方法,步骤S3中批改痕迹默认值判断方法可进一步对最大的批改痕迹进行二次校验,所述二次校验步骤进一步包括:S31、判断判断该题是否存在小题,不存在小题,则无需二次校验,若存在小题,则进一步识别小题的分布方式;S32、若小题为纵向分布,则进一步计算该最大批改痕迹的纵向上所占高度为该题整体纵向上高度的比例值,若该比例值超过预设阈值,则可将该最大批改痕迹的结果做为默认值;S33、若小题为横向分布,则进一步计算该最大批改痕迹的横向上所占长度为该题整体横向上长度的比例值,若该比例值超过预设阈值,则可将该最大批改痕迹的结果做为默认值;S34、若小题为纵横分布,则进一步可以根据纵向高度与横向长度的大小或比例关系,判断该题整体更偏向于纵向分布还是横向分布,再根据该整体偏向的分布结构进行识别。3.根据权利要求2所述的方法,步骤S5中的批改痕迹进行二次校验,当且仅当批改痕迹再小题区域所占比例大于预设阈值时,该批改痕迹才认为为有效批改痕迹。4.根据权利要求3所述的方法,所述模板数据包括页面数据及题目数据。5.根据权利要求4所述的方法,所述页面数据包括页面的宽高数据或/和页码;所述题目数据包括题目的坐标数据。6.一种机器学习的小题识别装置,其包括如下单元:批改痕迹识别单元、用于获取待识别目标的模板数据,根据所述模板数据对所述待识别目标进行图像分割,依次对分割的图像进行批改痕迹提取;并使用预设的识别模型...

【专利技术属性】
技术研发人员:秦曙光
申请(专利权)人:珠海读书郎软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1