一种字符识别方法及装置制造方法及图纸

技术编号：13793207 阅读：73 留言：0更新日期：2016-10-06 06:05

本发明专利技术实施例提供一种字符识别方法及装置，通过对待识别图像进行放大处理，生成高像素待识别图像；对高像素待识别图像进行二值化处理，滤除高像素待识别图像中的干扰因素；采用投影直方图方法，从二值化图像中获取包含待识别字符的图片；将获取的包含待识别字符的图片输入多层人工神经网络模型，获取该多层人工神经网络模型输出的待识别字符。采用本发明专利技术技术方案，对高像素待识别图像进行二值化处理，能够有效滤除背景图像等干扰因素，保证了最终识别结果的准确性；采用投影直方图方法对二值化图像进行切分，保证了切分得到的每一个包含待识别字符的图片中均包含一个完整字符，识别结果准确率更高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及图像处理领域，尤其涉及一种字符识别方法及装置。
技术介绍
验证码是一种区分用户是计算机还是人的计算机程序。验证码技术通过一次强制的用户交互过程，能够有效防止恶意破解密码，频繁自动提交某项任务等行为。随着计算机技术的发展，采用图形图像处理技术也能够对验证码进行识别。具体的，对验证码所在图片进行切分，并对切分后的图片进行识别，以确定图片中包含的验证码。其中，通常采用如下两种方式对验证码所在图片进行切分，第一种切分方式，根据预设的切分宽度进行切分，第二种切分方式，根据图像中的梯度值进行切分；由于验证码中可能包含不同宽度的字符，因此，当采用第一种切分方式时，将存在很大的误差；由于验证码可能包含背景图像等，背景图像会成为干扰因素，因此，当采用第二种切分方式时，仅通过梯度值识别验证码，无法滤除上述干扰因素，将造成切分结果存在误差。由此可见，目前在对验证码中包含的字符进行识别的过程中，存在字符识别结果误差大的问题。
技术实现思路
本专利技术实施例提供一种字符识别方法及装置，用以解决目前在对验证码中包含的字符进行识别的过程中，存在字符识别结果误差大的问题。本专利技术实施例提供的具体技术方案如下：本专利技术实施例提供一种字符识别方法，包括：获取待识别图像；其中，所述待识别图像中包含待识别字符；根据预设的放大比例，对所述待识别图像进行放大处理，获取放大处理后的高像素待识别图像；对所述高像素待识别图像进行二值化处理，生成二值化图像；采用投影直方图方法，从所述二值化图像中获取包含待识别字符的图片；从所述包含待识别字符的图片中，获取待识别字符。一种字符识别装置，包...

【技术保护点】
一种字符识别方法，其特征在于，包括：获取待识别图像；其中，所述待识别图像中包含待识别字符；根据预设的放大比例，对所述待识别图像进行放大处理，生成放大处理后的高像素待识别图像；对所述高像素待识别图像进行二值化处理，生成二值化图像；采用投影直方图方法，从所述二值化图像中获取包含待识别字符的图片；从所述包含待识别字符的图片中，获取待识别字符。

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：获取待识别图像；其中，所述待识别图像中包含待识别字符；根据预设的放大比例，对所述待识别图像进行放大处理，生成放大处理后的高像素待识别图像；对所述高像素待识别图像进行二值化处理，生成二值化图像；采用投影直方图方法，从所述二值化图像中获取包含待识别字符的图片；从所述包含待识别字符的图片中，获取待识别字符。2.根据权利要求1所述的方法，其特征在于，采用投影直方图方法，从二值化图像中获取包含待识别字符的图片，具体包括：获取预设投影直线斜率范围；将所述二值化图像中的每一个黑色像素点分别投影在所述预设投影直线斜率范围中的每一个斜率对应的直线上，建立每一个斜率对应的直方图；分别对每一个斜率对应的直方图进行扫描，确定每一个斜率对应的直方图的谷值区间；其中，所述谷值区间用于表征所述待识别图像中每相邻两个待识别字符之间间隙的范围；根据确定的每一个斜率对应的直方图的谷值区间，以及预设的目标函数，从所述预设投影直线斜率范围中，选取目标函数值最小的斜率；根据选取的斜率，以及所述选取的斜率对应的谷值区间，对所述二值化图像进行切分，获取包含待识别字符的图片。3.如权利要求2所述的方法，其特征在于，将所述二值化图像中的每一个黑色像素点分别投影在所述预设投影直线斜率范围中的每一个斜率对应的直线上，建立每一个斜率对应的直方图，具体包括：针对所述二值化图像中的每一个黑色像素点，均执行如下操作：按照预设斜率步长，将该黑色像素点依次投影到所述预设投影直线斜率范围内的每一个斜率对应的直线上；分别根据所述每一个斜率和该黑色像素点的位置坐标，获取该黑色像素点分别在每一个斜率对应的直线上的坐标值；根据获取的所述每一个黑色像素点分别在每一个斜率对应的直线上的坐标值，建立每一个斜率对应的直方图。4.根据权利要求3所述的方法，其特征在于，根据获取的所述每一个黑
\t色像素点在每一个斜率对应的直线上的坐标值，建立每一个斜率对应的直方图，具体包括：针对每一个斜率对应的直线，均执行如下操作：根据预设区间，将该斜率对应的直线离散化；根据每一个黑色像素点在该斜率对应的直线上的坐标值，获取每个预设区间内包含的黑色像素点的数目；根据每个预设区间内包含的黑色像素点的数目，建立该斜率对应的直方图；其中，所述直方图中每一个直方的直方宽度为该预设直方区间长度，直方高度为该预设直方区间范围内包含的像素点的数目。5.根据权利要求2-4任一项所述的方法，其特征在于，分别对每一个斜率对应的直方图进行扫描，确定每一个斜率对应的直方图的谷值区间，具体包括：获取所述待识别字符的数目；根据待识别字符的数目，确定单个待识别字符最小宽度和单个待识别字符最大宽度；针对每一个斜率对应的直方图，均执行如下操作：根据每一个预设区间对应的直方高度，从该斜率对应的直方图中，选取所述直方高度低于相邻两侧直方高度的区间，将选取的区间确定为初始谷值区间；根据所述单个待识别字符最小宽度和单个待识别字符最大宽度，从所述初始谷值区间中，去除伪谷值区间；根据去除的所述伪谷值区间，以及去除所述伪谷值区间后，剩余的初始谷值区间，确定该斜率对应的直方图的谷值区间。6.根据权利要求1所述的方法，其特征在于，从所述包含待识别字符的图片中，获取待识别字符，具体包括：将所述包含待识别字符的图片输入多层人工神经网络；其中，所述包含待识别字符的图片的数目为M个，所述M为大于0的正整数；针对所述M个包含待识别字符的图片中的每一个包含待识别字符的图片，均执行如下操作：获取所述多层人工神经网络模型输出的该包含待识别字符的图片对应的识别结果。7.根据权利要求6所述的方法，其特征在于，获取所述多层人工神经网络模型输出的该包含待识别...

【专利技术属性】
技术研发人员：王育军，
申请(专利权)人：乐视致新电子科技天津有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人