一种基于支持向量机的复选框选择状态的识别方法及装置制造方法及图纸

技术编号：18115743 阅读：32 留言：0更新日期：2018-06-03 08:35

本发明专利技术实施例公开了一种基于支持向量机的复选框选择状态的识别方法及装置，该方法包括：获取预处理的目标待识别图像；按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征向量，并获取所述目标待识别图像的方向梯度直方图特征向量；将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中，获取识别结果。本发明专利技术实施例能够消除复杂背景以及噪声对图像识别造成的不良影响，提高了判断复选框是否处于选中状态的识别效率，鲁棒性能好，有效地提升了复选框选择状态的识别准确性，且应用范围广泛。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于支持向量机的复选框选择状态的识别方法及装置
本专利技术实施例涉及图像识别
，尤其涉及一种基于支持向量机的复选框选择状态的识别方法及装置。
技术介绍
随着我国信息化的快速发展，各行各业对于图像识别的需求越来越多，在银行票据、税务报表、标准化考试的答题卡、以及人口普查表等数据表单中，通常含有需用户填写的复选框，判断复选框选中与否的结果十分重要。现有技术中，通常采用以下方法识别复选框的选中状态：1、通过人工识别复选框的选中状态之后，再输入到计算机系统进行存储。该方法人力成本较高、对于大量需要识别的数据表单，识别效率低。2、通过分割出复选框并采用模板匹配的方法识别复选框的选中状态，但是，该方法没有考虑到手写符号对于分割复选框的影响，通常情况下，手写符号会超出复选框的范围，在此基础上进行模板匹配会导致识别准确率低，而且如果模板匹配的匹配目标发生旋转或者大小变化，则算法失效。该方法对于符号的填写位置存在一定的限制，应用范围不广。
技术实现思路
本专利技术实施例提供一种基于支持向量机的复选框选择状态的识别方法及装置，解决现有技术中识别效率低、应用范围不广的问题。第一方面，本专利技术实施例提供了一种基于支持向量机的复选框选择状态的识别方法及装置，包括：获取预处理的目标待识别图像；按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征向量，并获取所述目标待识别图像的方向梯度直方图特征向量；将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中，获取识别结果。第二方面，...
一种基于支持向量机的复选框选择状态的识别方法及装置

【技术保护点】
一种基于支持向量机的复选框选择状态的识别方法，其特征在于，包括：获取预处理的目标待识别图像；按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征向量，并获取所述目标待识别图像的方向梯度直方图特征向量；将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中，获取识别结果。

【技术特征摘要】
1.一种基于支持向量机的复选框选择状态的识别方法，其特征在于，包括：获取预处理的目标待识别图像；按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征向量，并获取所述目标待识别图像的方向梯度直方图特征向量；将所述目标待识别图像的方向梯度直方图特征向量输入至训练后的支持向量机分类模型中，获取识别结果。2.根据权利要求1所述的方法，其特征在于，获取预处理的目标待识别图像包括：滤除所述目标待识别图像的噪声；按照预设图像大小，对所述目标待识别图像进行重采样；对所述重采样的目标待识别图像进行伽马校正，获取所述目标待识别图像的预处理结果。3.根据权利要求1所述的方法，其特征在于，按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征向量，包括：计算所述目标待识别图像中各像素点的梯度值，所述梯度值包括梯度幅值以及梯度方向；按照第一预设尺度对所述目标待识别图像执行与所述第一预设尺度对应的分块操作，获取区域分块图像；按照第二预设尺度对所述区域分块图像执行与所述第二预设尺度对应的分块操作，获取子区域分块图像；按照预设的梯度方向区间，统计所述子区域分块图像中各个所述梯度方向区间对应的梯度幅值，将统计结果作为所述子区域分块图像的方向梯度直方图特征向量。4.根据权利要求3所述的方法，其特征在于，获取所述目标待识别图像的方向梯度直方图特征向量，包括：根据计算式对所述子区域分块图像的方向梯度直方图特征向量进行归一化操作，其中，v表示所述子区域分块图像的方向梯度直方图特征向量，||v||表示v的L2范数，e表示偏移量，f表示所述子区域分块图像的方向梯度直方图特征向量的归一化结果；将所述目标待识别图像中所有归一化后的所述子区域分块图像的方向梯度直方图特征向量按照预设的选取标准顺序排列，构成所述目标待识别图像的方向梯度直方图特征向量；根据计算公式对所述目标待识别图像的方向梯度直方图特征向量进行标准化操作，获取标准化的所述目标待识别图像的方向梯度直方图特征向量，其中，v表示所述目标待识别图像的方向梯度直方图特征向量，μn表示所述目标待识别图像的方向梯度直方图特征向量的均值，σn表示所述目标待识别图像的方向梯度直方图特征向量的方差，v'表示标准化结果。5.根据权利要求3所述的方法，其特征在于，计算所述目标待识别图像中各像素点的梯度幅值，以及梯度幅值对应的梯度方向，包括：如果所述目标待识别图像为灰度图像，则根据计算式计算出所述目标待识别图像中各像素点的梯度幅值，其中，G(x,y)表示像素点的梯度幅值，α(x,y)表示像素点的梯度方向，所述梯度方向为像素点垂直方向梯度幅值与水平方向梯度幅值的一阶倒数，H(X,Y)表示像素点的灰度值；如果所述目标待识别图像为彩色图像，则计算所述彩色图像中各像素点的各颜色通道的梯度幅值，以及所述各颜色通道的梯度幅值对应的梯度方向。6.根据权利要求1所述的方法，其特征在于，按照不同的预设尺度对所述目标待识别图像执行与所述不同的预设尺度对应的分块操作，获取分块图像，提取所述分块图像的方向梯度直方图特征...

【专利技术属性】
技术研发人员：杨飞，高昊江，候金利，
申请(专利权)人：京北方信息技术股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人