一种字符识别方法及装置制造方法及图纸

技术编号:13793207 阅读:73 留言:0更新日期:2016-10-06 06:05
本发明专利技术实施例提供一种字符识别方法及装置,通过对待识别图像进行放大处理,生成高像素待识别图像;对高像素待识别图像进行二值化处理,滤除高像素待识别图像中的干扰因素;采用投影直方图方法,从二值化图像中获取包含待识别字符的图片;将获取的包含待识别字符的图片输入多层人工神经网络模型,获取该多层人工神经网络模型输出的待识别字符。采用本发明专利技术技术方案,对高像素待识别图像进行二值化处理,能够有效滤除背景图像等干扰因素,保证了最终识别结果的准确性;采用投影直方图方法对二值化图像进行切分,保证了切分得到的每一个包含待识别字符的图片中均包含一个完整字符,识别结果准确率更高。

【技术实现步骤摘要】

本专利技术实施例涉及图像处理领域,尤其涉及一种字符识别方法及装置
技术介绍
验证码是一种区分用户是计算机还是人的计算机程序。验证码技术通过一次强制的用户交互过程,能够有效防止恶意破解密码,频繁自动提交某项任务等行为。随着计算机技术的发展,采用图形图像处理技术也能够对验证码进行识别。具体的,对验证码所在图片进行切分,并对切分后的图片进行识别,以确定图片中包含的验证码。其中,通常采用如下两种方式对验证码所在图片进行切分,第一种切分方式,根据预设的切分宽度进行切分,第二种切分方式,根据图像中的梯度值进行切分;由于验证码中可能包含不同宽度的字符,因此,当采用第一种切分方式时,将存在很大的误差;由于验证码可能包含背景图像等,背景图像会成为干扰因素,因此,当采用第二种切分方式时,仅通过梯度值识别验证码,无法滤除上述干扰因素,将造成切分结果存在误差。由此可见,目前在对验证码中包含的字符进行识别的过程中,存在字符识别结果误差大的问题。
技术实现思路
本专利技术实施例提供一种字符识别方法及装置,用以解决目前在对验证码中包含的字符进行识别的过程中,存在字符识别结果误差大的问题。本专利技术实施例提供的具体技术方案如下:本专利技术实施例提供一种字符识别方法,包括:获取待识别图像;其中,所述待识别图像中包含待识别字符;根据预设的放大比例,对所述待识别图像进行放大处理,获取放大处理后的高像素待识别图像;对所述高像素待识别图像进行二值化处理,生成二值化图像;采用投影直方图方法,从所述二值化图像中获取包含待识别字符的图片;从所述包含待识别字符的图片中,获取待识别字符。一种字符识别装置,包括:图像获取单元,用于获取待识别图像;其中,所述待识别图像中包含待识别字符;图像处理单元,用于根据预设的放大比例,对所述待识别图像进行放大处理,生成放大处理后的高像素待识别图像;且图像处理单元还用于对所述高像素待识别图像进行二值化处理,生成二值化图像;图片获取单元,用于采用投影直方图方法,从所述二值化图像中获取包含待识别字符的图片;字符识别单元,用于从所述包含待识别字符的图片中,获取待识别字符。本专利技术实施例提供的字符识别方法及装置,通过对待识别图像进行放大处理,生成高像素待识别图像;对高像素待识别图像进行二值化处理,滤除高像素待识别图像中的干扰因素;采用投影直方图方法,从二值化图像中获取包含待识别字符的图片;从获取的包含待识别字符的图片中,获取待识别字符。采用本专利技术技术方案,对待识别图像进行放大处理,避免后续直接对待识别图像进行二值化处理时,生成的二值化处理后的图像边缘不均匀,保证了最终识别结果的准确性;并且,对高像素待识别图像进行二值化处理,能够有效滤除背景图像等干扰因素,进一步保证了最终识别结果的准确性;采用投影直方图方法对二值化图像进行切分,保证了切分得到的每一个包含待识别字符的图片中均包含一个完整字符,从而提高了识别结果的准确率。附图说明图1为本专利技术实施例中图像处理系统结构示意图;图2为本专利技术实施例中字符识别流程图;图3a为本专利技术实施例中在待识别图像中建立的直角坐标系;图3b为本专利技术实施例中插值运算示意图;图4为本专利技术实施例中获取高像素待识别图像中每一个像素点的像素值的流程图;图5为本专利技术实施例中获取包含待识别字符的图片流程图;图6a为本专利技术实施例中投影直线斜率范围示意图;图6b为本专利技术实施例中任意一斜率对应的直方图示意图;图7为本专利技术实施例中待识别图像和包含待识别字符的图片对比示意图;图8为本专利技术实施例中字符识别装置结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参阅图1所示,为本专利技术实施例中图像处理系统架构示意图,该图像处理系统包括字符识别装置,该字符识别装置用于将获取到的待识别图像进行处理,以从待识别图像中识别出字符,该字符识别装置可以具备用户交互界面,以便于向用户呈现识别结果;可选的,上述图像处理系统中还可以包含图像采集设备,用于采集待识别图像,并将采集到的待识别图像发送至字符识别装置。可选的,上述字符识别装置可以为单独的设备,也可以为一个多功能图像处理设备中的一部分,本专利技术实施例以上述字符识别装置可以为单独的设备为例进行介绍。下面结合说明书附图,对本专利技术实施例作进一步详细描述。参阅图2所示,本专利技术实施例中,字符识别装置从待识别图像中进行字符识别的过程,包括:步骤200:获取待识别图像;其中,该待识别图像中包含待识别字符。步骤210:根据预设的放大比例,对上述待识别图像进行放大处理,生成放大处理后的高像素待识别图像。步骤220:对上述高像素待识别图像进行二值化处理,生成二值化图像。步骤230:采用投影直方图方法,从上述二值化图像中获取包含待识别字符的图片。步骤240:从上述包含待识别字符的图片中,获取待识别字符。在步骤200中,图像采集设备将获取的待识别图像发送至字符识别装置。其中,图像采集设备可以从各个网站的用户验证页面或者选中信息确认页面等包含验证码的页面中选取待识别图像;该待识别图像即为包含验证码的图像。在步骤210中,字符识别装置根据预设的放大比例,确定高像素待识别图像中每一个像素点的位置,并采用双线性插值算法,对上述待识别图像进行图像放大处理,获取高像素待识别图像中每一个像素点的像素值,以及根据上述每一个放大处理后的像素点的像素值和位置,生成高像素图像。其中,该预设的放大比例为根据具体应用场景预先配置的值;预设的放大比例包括预设的横向放大比例和预设的纵向放大比例,且横向放大比例与纵向放大比例可以相等,也可以不等。本申请实施例中,参阅图3a所示,图像处理设备在待识别图像中建立直角坐标系,将水平方向作为横轴,将与横轴垂直的竖直方向作为纵轴,将待识别图像的左下角作为原点。参阅图4所示,在字符识别装置生成高像素待识别图像的过程中,字符识别装置基于上述直角坐标系,获取高像素待识别图像中每一个像素点的像素值的过程,具体包括:步骤a1:字符识别装置根据预设的放大比例,在该待识别图像中包含的所有原始像素点中,确定每一个放大处理后的像素点对应的四个原始像素点。步骤a2:字符识别装置确定上述每一个放大处理后的像素点对应的四个原始像素点中,第一方向的两对原始像素点,以及第二方向的两对原始像素点;其中,该第一方向为水平方向,第二方向为竖直方向,或者,该第一方向为竖直方向,第二方向为水平方向。本专利技术实施例中,图像处理设备将一个放大处理后的像素点对应的四个原始图像划分为两对,其中,将四个原始像素点中处于同一行或者同一列的两个原始像素图像作为一对;基于此,一个放大处理后的像素点对应的原始像素点即为第一方向上的两对原始像素点,以及第二方向上的两对原始像素点。例如,参阅图3b所示,若第一方向为横轴正方向,第二方向为纵轴正方向,则第一方向的两对原始像素点分别为Q11和Q12,以及Q21和Q22,第二方向的两对原始像素点分别为Q11和Q21,以及Q12和Q22。步骤a3:字符识别装置获取上本文档来自技高网...

【技术保护点】
一种字符识别方法,其特征在于,包括:获取待识别图像;其中,所述待识别图像中包含待识别字符;根据预设的放大比例,对所述待识别图像进行放大处理,生成放大处理后的高像素待识别图像;对所述高像素待识别图像进行二值化处理,生成二值化图像;采用投影直方图方法,从所述二值化图像中获取包含待识别字符的图片;从所述包含待识别字符的图片中,获取待识别字符。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取待识别图像;其中,所述待识别图像中包含待识别字符;根据预设的放大比例,对所述待识别图像进行放大处理,生成放大处理后的高像素待识别图像;对所述高像素待识别图像进行二值化处理,生成二值化图像;采用投影直方图方法,从所述二值化图像中获取包含待识别字符的图片;从所述包含待识别字符的图片中,获取待识别字符。2.根据权利要求1所述的方法,其特征在于,采用投影直方图方法,从二值化图像中获取包含待识别字符的图片,具体包括:获取预设投影直线斜率范围;将所述二值化图像中的每一个黑色像素点分别投影在所述预设投影直线斜率范围中的每一个斜率对应的直线上,建立每一个斜率对应的直方图;分别对每一个斜率对应的直方图进行扫描,确定每一个斜率对应的直方图的谷值区间;其中,所述谷值区间用于表征所述待识别图像中每相邻两个待识别字符之间间隙的范围;根据确定的每一个斜率对应的直方图的谷值区间,以及预设的目标函数,从所述预设投影直线斜率范围中,选取目标函数值最小的斜率;根据选取的斜率,以及所述选取的斜率对应的谷值区间,对所述二值化图像进行切分,获取包含待识别字符的图片。3.如权利要求2所述的方法,其特征在于,将所述二值化图像中的每一个黑色像素点分别投影在所述预设投影直线斜率范围中的每一个斜率对应的直线上,建立每一个斜率对应的直方图,具体包括:针对所述二值化图像中的每一个黑色像素点,均执行如下操作:按照预设斜率步长,将该黑色像素点依次投影到所述预设投影直线斜率范围内的每一个斜率对应的直线上;分别根据所述每一个斜率和该黑色像素点的位置坐标,获取该黑色像素点分别在每一个斜率对应的直线上的坐标值;根据获取的所述每一个黑色像素点分别在每一个斜率对应的直线上的坐标值,建立每一个斜率对应的直方图。4.根据权利要求3所述的方法,其特征在于,根据获取的所述每一个黑
\t色像素点在每一个斜率对应的直线上的坐标值,建立每一个斜率对应的直方图,具体包括:针对每一个斜率对应的直线,均执行如下操作:根据预设区间,将该斜率对应的直线离散化;根据每一个黑色像素点在该斜率对应的直线上的坐标值,获取每个预设区间内包含的黑色像素点的数目;根据每个预设区间内包含的黑色像素点的数目,建立该斜率对应的直方图;其中,所述直方图中每一个直方的直方宽度为该预设直方区间长度,直方高度为该预设直方区间范围内包含的像素点的数目。5.根据权利要求2-4任一项所述的方法,其特征在于,分别对每一个斜率对应的直方图进行扫描,确定每一个斜率对应的直方图的谷值区间,具体包括:获取所述待识别字符的数目;根据待识别字符的数目,确定单个待识别字符最小宽度和单个待识别字符最大宽度;针对每一个斜率对应的直方图,均执行如下操作:根据每一个预设区间对应的直方高度,从该斜率对应的直方图中,选取所述直方高度低于相邻两侧直方高度的区间,将选取的区间确定为初始谷值区间;根据所述单个待识别字符最小宽度和单个待识别字符最大宽度,从所述初始谷值区间中,去除伪谷值区间;根据去除的所述伪谷值区间,以及去除所述伪谷值区间后,剩余的初始谷值区间,确定该斜率对应的直方图的谷值区间。6.根据权利要求1所述的方法,其特征在于,从所述包含待识别字符的图片中,获取待识别字符,具体包括:将所述包含待识别字符的图片输入多层人工神经网络;其中,所述包含待识别字符的图片的数目为M个,所述M为大于0的正整数;针对所述M个包含待识别字符的图片中的每一个包含待识别字符的图片,均执行如下操作:获取所述多层人工神经网络模型输出的该包含待识别字符的图片对应的识别结果。7.根据权利要求6所述的方法,其特征在于,获取所述多层人工神经网络模型输出的该包含待识别...

【专利技术属性】
技术研发人员:王育军
申请(专利权)人:乐视致新电子科技天津有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1