针对线状干扰的去噪方法和去噪装置制造方法及图纸

技术编号:19935057 阅读:31 留言:0更新日期:2018-12-29 04:51
本发明专利技术公开了一种针对线状干扰的去噪方法和去噪装置,涉及计算机技术领域。该方法的一具体实施方式包括:将原始图像进行预处理以得到二值化图像;确定二值化图像中每个字符对应的坐标区间;根据字符对应的坐标区间确定字符对应的首端点和末端点的坐标;根据每个字符对应的首端点和末端点的坐标求解噪声曲线表达式;使用噪声曲线表达式预测噪声并去除。该实施方式可以准确地进行噪声曲线表达式的分段求解,更好地拟合噪声曲线,实现更准确地识别字符,进而提高整张验证码的识别成功率。

【技术实现步骤摘要】
针对线状干扰的去噪方法和去噪装置
本专利技术涉及计算机
,尤其涉及一种针对线状干扰的去噪方法和去噪装置。
技术介绍
随着爬虫技术的兴起,越来越多的业务展开开始借助于网络爬虫的数据抓取能力,而出于对安全及流量控制的考量,各个网站也相继启用了验证码验证来作为阻挡网络爬虫的一道关卡,随着图像识别技术的飞速发展,验证码的花样也逐步拓展翻新,从最早的字符端正、大小一致、背景干净到后期背景变色,加入各种噪声,字符旋转模糊变形,可以说,图像识别是打开这道门的钥匙,而图像的去噪处理则是图像识别前序操作中的关键一步。而在诸多验证码中存在这样一类含有严重干扰的情况,主要干扰噪声为长短粗细不一的非规则条线,即:线状干扰。如图1所示,是具有线状干扰的验证码原始图像示意图。对于线状干扰,目前常用的去噪方案有如下两种:方案1、对验证码图像进行简要的去噪处理(如:去除图像上与验证码字符明显无关的干扰信息)后,根据垂直投影,水平投影算法进行字符的细分切割,利用大量打标数据对存在干扰形变的字符进行识别。切割后的字符效果如图2所示,根据图2,可以看到将图1所示的验证码原始图像切割为4个仍具有部分干扰的字符;方案2本文档来自技高网...

【技术保护点】
1.一种针对线状干扰的去噪方法,其特征在于,包括:将原始图像进行预处理以得到二值化图像;确定所述二值化图像中每个字符对应的坐标区间;根据所述字符对应的坐标区间确定所述字符对应的首端点和末端点的坐标;根据每个字符对应的首端点和末端点的坐标求解噪声曲线表达式;使用所述噪声曲线表达式预测噪声并去除。

【技术特征摘要】
1.一种针对线状干扰的去噪方法,其特征在于,包括:将原始图像进行预处理以得到二值化图像;确定所述二值化图像中每个字符对应的坐标区间;根据所述字符对应的坐标区间确定所述字符对应的首端点和末端点的坐标;根据每个字符对应的首端点和末端点的坐标求解噪声曲线表达式;使用所述噪声曲线表达式预测噪声并去除。2.根据权利要求1所述的去噪方法,其特征在于,确定所述二值化图像中每个字符对应的坐标区间包括:对所述二值化图像做垂直投影,以得到所述二值化图像对应X轴坐标的每一列包括的灰度值为0的像素点的个数;根据包括的灰度值为0的像素点的个数大于预设的噪声阈值的列对应的X轴坐标得到坐标区间集合;根据预设的字符宽度范围,对所述坐标区间集合进行调整,以得到每个字符对应的坐标区间。3.根据权利要求2所述的去噪方法,其特征在于,对所述坐标区间集合进行调整包括:步骤1:依次获取每个坐标区间,并对每个坐标区间执行以下步骤2至步骤5;步骤2:判断所述坐标区间的长度是否小于预设的最小字符宽度,若是,则执行步骤3,否则,不对所述坐标区间进行处理;步骤3:将所述坐标区间的右区间值修改为与所述坐标区间相邻的下一个坐标区间的右区间值,并判断修改后的坐标区间的长度是否位于所述预设的字符宽度范围内,若是,则执行步骤4,否则执行步骤5;步骤4:更新所述坐标区间并删除所述下一个坐标区间以更新所述坐标区间集合;步骤5:若修改后的坐标区间的长度仍小于所述预设的最小字符宽度,则重复执行上述步骤3,直至修改后的坐标区间的长度位于所述预设的字符宽度范围内,然后执行步骤4;若修改后的坐标区间的长度大于预设的最大字符宽度,则撤销对所述坐标区间进行的最后一次修改,然后更新所述坐标区间和所述坐标区间集合。4.根据权利要求1所述的去噪方法,其特征在于,根据所述字符对应的坐标区间确定所述字符对应的首端点和末端点的坐标包括:由上至下依次读取所述坐标区间的左端点的左边一列包括的像素点的灰度值,将灰度值由255变为0时的灰度值为0的像素点作为所述字符对应的首端点的上限点,将灰度值由0变为255时的灰度值为0的像素点作为所述字符对应的首端点的下限点,并将所述首端点的上限点和所述首端点的下限点的中点作为所述字符对应的首端点;由上至下依次读取所述坐标区间的右端点的右边一列包括的像素点的灰度值,将灰度值由255变为0时的灰度值为0的像素点作为所述字符对应的末端点的上限点,将灰度值由0变为255时的灰度值为0的像素点作为所述字符对应的末端点的下限点,并将所述末端点的上限点和所述末端点的下限点的中点作为所述字符对应的末端点。5.根据权利要求1所述的去噪方法,其特征在于,根据每个字符对应的首端点和末端点的坐标求解噪声曲线表达式包括:对于非最后一个字符的每个字符,以所述字符对应的首端点坐标、末端点坐标,及与所述字符相邻的下一个字符的首端点坐标作为一组取值来求解所述字符对应的第一子噪声曲线表达式,且所述第一子噪声曲线表达式对应的坐标区间为所述字符的首端点的X坐标值至所述下一个字符的首端点的X坐标值;对于最后一个字符,以所述字符对应的首端点坐标、末端点坐标,及与所述字符相邻的上一个字符的末端点坐标作为一组取值来求解所述字符对应的第二子噪声曲线表达式,且所述第二子噪声曲线表达式对应的坐标区间为所述上一个字符的末端点的X坐标值至所述字符的末端点的X坐标值;由非最后一个字符的每个字符对应的第一子噪声曲线表达式和最后一个字符对应的第二子噪声曲线表达式构成所述二值化图像的噪声曲线表达式。6.根据权利要求1或5所述的去噪方法,其特征在于,根据每个字符对应的首端点和末端点的坐标求解噪声曲线表达式之前,还包括:根据每个字符对应的首端点和末端点的坐标,计算相邻的两个字符的字符间隔,并确定所述字符间隔在预设的字符间隔范围之内。7.根据权利要求1所述的去噪方法,其特征在于,使用所述噪声曲线表达式预测噪声并去除包括:计算所述噪声曲线表达式对应的坐标区间内的每个X坐标值对应的Y坐标值;对于每个X坐标值对应的列,以所述X坐标值对应的Y坐标值为中点,分别向上、向下获取与预设的噪声阈值相等个数的像素点,并将获取的像素点中灰度值为0的像素点保存到预测噪声集合中;计算所述预测噪声集合中每个X坐标值对应的列包括的连续像素点的最大个数,将所述最大个数不大于所述预设的噪声阈值的列包括的像素点中与所述列对应的Y坐标值最接近的连续像素点确定为第一噪声;将所述噪声曲线表达式对应的坐标区间之外的X坐标值对应的每一列包括的灰度值为0的像素点确定为第二噪声;将所述第一噪声和所述第二噪声去除。8.一种针对线状干扰的去噪装置,其特征在于,包括:预处理模块,用于将原始图像进行预处理以得到二值化图像;区间确定模块,用于确定所述二值化图像中每个字符对应的坐标区间;...

【专利技术属性】
技术研发人员:李春华
申请(专利权)人:北京京东金融科技控股有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1