一种基于支持向量机的复选框选择状态的识别方法及装置制造方法及图纸

技术编号:18115743 阅读:32 留言:0更新日期:2018-06-03 08:35
本发明专利技术实施例公开了一种基于支持向量机的复选框选择状态的识别方法及装置,该方法包括:获取预处理的目标待识别图像;按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。本发明专利技术实施例能够消除复杂背景以及噪声对图像识别造成的不良影响,提高了判断复选框是否处于选中状态的识别效率,鲁棒性能好,有效地提升了复选框选择状态的识别准确性,且应用范围广泛。

【技术实现步骤摘要】
一种基于支持向量机的复选框选择状态的识别方法及装置
本专利技术实施例涉及图像识别
,尤其涉及一种基于支持向量机的复选框选择状态的识别方法及装置。
技术介绍
随着我国信息化的快速发展,各行各业对于图像识别的需求越来越多,在银行票据、税务报表、标准化考试的答题卡、以及人口普查表等数据表单中,通常含有需用户填写的复选框,判断复选框选中与否的结果十分重要。现有技术中,通常采用以下方法识别复选框的选中状态:1、通过人工识别复选框的选中状态之后,再输入到计算机系统进行存储。该方法人力成本较高、对于大量需要识别的数据表单,识别效率低。2、通过分割出复选框并采用模板匹配的方法识别复选框的选中状态,但是,该方法没有考虑到手写符号对于分割复选框的影响,通常情况下,手写符号会超出复选框的范围,在此基础上进行模板匹配会导致识别准确率低,而且如果模板匹配的匹配目标发生旋转或者大小变化,则算法失效。该方法对于符号的填写位置存在一定的限制,应用范围不广。
技术实现思路
本专利技术实施例提供一种基于支持向量机的复选框选择状态的识别方法及装置,解决现有技术中识别效率低、应用范围不广的问题。第一方面,本专利技术实施例提供了一种基于支持向量机的复选框选择状态的识别方法及装置,包括:获取预处理的目标待识别图像;按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。第二方面,本专利技术实施例还提供了一种基于支持向量机的复选框选择状态的识别装置,包括:预处理模块,用于获取预处理的目标待识别图像;特征向量获取模块,用于按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;识别模块,用于将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。本专利技术实施例通过对预处理的目标待识别图像按照不同的预设尺度进行分块操作,提取分块图像的方向梯度直方图特征向量,通过对图像局部的处理,能够消除复杂背景以及噪声对图像识别造成的不良影响,并进一步将获取的目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。本专利技术实施例提高了对复选框选中状态的识别效率,鲁棒性能好,有效地提升了复选框状态的识别准确性,且应用范围广泛。附图说明图1是本专利技术实施例一中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图2a是本专利技术实施例二中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图2b是本专利技术实施例二中的目标待识别负样本图像的示意图;图2c是本专利技术实施例二中的目标待识别负样本图像的方向梯度直方图特征向量的示意图;图2d是本专利技术实施例二中的目标待识别正样本图像的示意图;图2e是本专利技术实施例二中的目标待识别正样本图像的方向梯度直方图特征向量的示意图;图3为本专利技术实施例三中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图4a为本专利技术实施例四中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图4b为本专利技术实施例四中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图5为本专利技术实施例五中的一种基于支持向量机的复选框选择状态的识别方法的流程图;图6是本专利技术实施例六中的一种基于支持向量机的复选框选择状态的识别装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一图1为本专利技术实施例一提供的一种基于支持向量机的复选框选择状态的识别方法的流程图,本实施例可适用于通过将提取的待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型来进行识别复选框选中状态或非选中状态的情况,该方法可以由一种基于支持向量机的复选框选择状态的识别装置来执行,该装置可以采用软件和/或硬件的方式实现,一般集成于终端设备中,例如,台式机、一体机以及笔记本电脑等。如图1所示,本实施例的方法具体包括:S110、获取预处理的目标待识别图像。具体的,目标待识别图像可以理解为包括待识别复选框的选择状态的图像,选择状态可以包括选中状态或非选中状态,目标待识别图像可以为灰度图像,也可以为彩色图像,在获取目标待识别图像之后,对目标待识别图像进行预处理。优选的,获取预处理的目标待识别图像包括:滤除所述目标待识别图像的噪声;按照预设图像大小,对所述目标待识别图像进行重采样;对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。在本专利技术实施例一个可选的实施方式中,对目标待识别图像进行预处理可以包括滤除目标待识别图像的噪声,示例性地,可以采用高斯滤波器滤除目标待识别图像的噪声,按照预设图像大小,对滤除噪声后的目标待识别图像进行重采样,示例性地,可以采用三次卷积内插法对滤除噪声后的目标待识别图像进行重采样,也可以采用最邻近内插法或者双线性内插法对滤除噪声后的目标待识别图像进行重采样,本专利技术实施例对此并不限制。可以根据实际应用情况预设图像大小,例如,预设图像大小可以为32×32像素。对重采样后的目标待识别图像进行伽马校正,获取目标待识别图像的预处理结果。伽马校正可以对输入的目标待识别图像的灰度值进行非线性操作,使输出的目标待识别图像的灰度值与输入的目标待识别图像的灰度值成指数关系,以消除不均匀光照的不良影响,并可以进行图像对比度的调节。示例性地,伽马系数的取值范围可以设置在0.1至0.5之间。需要说明的是,本专利技术实施例在目标待识别图像进行预处理的过程中对操作步骤的执行顺序不做限制。S120、按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量。具体的,按照不同的预设尺度对目标待识别图像执行分块操作,在本专利技术实施例一个可选的实施方式中,预设尺度可以包括第一预设尺度和第二预设尺度,首先按照第一预设尺度对目标待识别图像进行分块操作,获取区域分块图像,示例性地,第一预设尺度可以为16×16像素,然后,在第一次分块操作的基础上,按照第二预设尺度对区域分块图像进行分块操作,获取子区域分块图像,示例性地,第二预设尺度可以为8×8像素。计本文档来自技高网...
一种基于支持向量机的复选框选择状态的识别方法及装置

【技术保护点】
一种基于支持向量机的复选框选择状态的识别方法,其特征在于,包括:获取预处理的目标待识别图像;按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。

【技术特征摘要】
1.一种基于支持向量机的复选框选择状态的识别方法,其特征在于,包括:获取预处理的目标待识别图像;按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,并获取所述目标待识别图像的方向梯度直方图特征向量;将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中,获取识别结果。2.根据权利要求1所述的方法,其特征在于,获取预处理的目标待识别图像包括:滤除所述目标待识别图像的噪声;按照预设图像大小,对所述目标待识别图像进行重采样;对所述重采样的目标待识别图像进行伽马校正,获取所述目标待识别图像的预处理结果。3.根据权利要求1所述的方法,其特征在于,按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征向量,包括:计算所述目标待识别图像中各像素点的梯度值,所述梯度值包括梯度幅值以及梯度方向;按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作,获取区域分块图像;按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作,获取子区域分块图像;按照预设的梯度方向区间,统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值,将统计结果作为所述子区域分块图像的方向梯度直方图特征向量。4.根据权利要求3所述的方法,其特征在于,获取所述目标待识别图像的方向梯度直方图特征向量,包括:根据计算式对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作,其中,v表示所述子区域分块图像的方向梯度直方图特征向量,||v||表示v的L2范数,e表示偏移量,f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果;将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列,构成所述目标待识别图像的方向梯度直方图特征向量;根据计算公式对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作,获取标准化的所述目标待识别图像的方向梯度直方图特征向量,其中,v表示所述目标待识别图像的方向梯度直方图特征向量,μn表示所述目标待识别图像的方向梯度直方图特征向量的均值,σn表示所述目标待识别图像的方向梯度直方图特征向量的方差,v'表示标准化结果。5.根据权利要求3所述的方法,其特征在于,计算所述目标待识别图像中各像素点的梯度幅值,以及梯度幅值对应的梯度方向,包括:如果所述目标待识别图像为灰度图像,则根据计算式计算出所述目标待识别图像中各像素点的梯度幅值,其中,G(x,y)表示像素点的梯度幅值,α(x,y)表示像素点的梯度方向,所述梯度方向为像素点垂直方向梯度幅值与水平方向梯度幅值的一阶倒数,H(X,Y)表示像素点的灰度值;如果所述目标待识别图像为彩色图像,则计算所述彩色图像中各像素点的各颜色通道的梯度幅值,以及所述各颜色通道的梯度幅值对应的梯度方向。6.根据权利要求1所述的方法,其特征在于,按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作,获取分块图像,提取所述分块图像的方向梯度直方图特征...

【专利技术属性】
技术研发人员:杨飞高昊江候金利
申请(专利权)人:京北方信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1