一种简易的印刷体数字识别方法技术

技术编号：18972758 阅读：30 留言：0更新日期：2018-09-19 03:47

本发明专利技术提供了一种简易的印刷体数字识别方法，属于图像处理技术领域。该方法包括数字检测、数字分类以及决策机制三部分：首先，获取数字图像，以亮度、区域面积、长宽比为特征检测数字区域；然后，根据获得的数字区域，利用数字的封闭特性、直方图特性将其粗分类为四部分，结合数字的穿线特征、局部直方图特征以及局部封闭性特征再对其进行细分类，进而识别各数字；最后，利用滤波与状态机结合的决策机制，提高数字识别的准确度，达到准确识别数字的目的。本发明专利技术通过设计分类决策树与决策机制并应用数字框，提高识别的准确性和鲁棒性，实现简易而准确的印刷体数字识别方法，具有很大的实用价值。

A simple method for recognition of printed numerals

The invention provides a simple printing digit recognition method, which belongs to the field of image processing technology. The method consists of three parts: first, the digital image is acquired and the digital region is detected by brightness, area and aspect ratio; then, according to the obtained digital region, the digital region is roughly classified into four parts by using the characteristics of digital enclosure and histogram. The line feature, the local histogram feature and the local closure feature are subdivided and classified to recognize the digits. Finally, the decision-making mechanism of combining filtering and state machine is used to improve the accuracy of digital recognition and achieve the purpose of identifying the digits accurately. The invention improves the accuracy and robustness of recognition by designing classification decision tree and decision mechanism and applying digital frame, realizes simple and accurate printed numeral recognition method, and has great practical value.

全部详细技术资料下载

【技术实现步骤摘要】
一种简易的印刷体数字识别方法
本专利技术涉及一种简易的印刷体数字识别方法，属于图像处理

技术介绍
如今对印刷体数字的识别已经得到了广泛的应用，如何简单、高效且准确地实现印刷体数字的识别是目前各种印刷体数字识别方法接下来面临的挑战。现有的印刷体数字识别方法主要有三类：基于模版匹配的数字识别方法、基于人工神经网络的数字识别方法以及基于特征分析的数字识别方法。传统的识别方法是模板匹配，该方法的主要问题在于计算量大、对模板的依赖性很强，导致其鲁棒性较弱，对图像的噪声和位移敏感；基于人工神经网络的数字识别方法是当前最为流行的方法，该方法适用于环境复杂、难以提取特征的情况，对处理器要求较高，需要较大的存储空间以及运行内存，不适用于印刷体数字的识别问题；基于特征分析的方法通过提取号码图像中的具有代表性的特征达到识别该数字的目的，当前研究中的数字特征主要有：焦点特征、封闭半封闭特征、横竖直线特征、投影特征以及分区面积特征等等，但是这些特征鲁棒性不够，受数字字体、倾斜度等因素影响程度不一，直接影响到实际应用中数字识别的准确率。
技术实现思路
为解决现有技术存在的问题，本专利技术提出一种简易的印刷体数字识别方法，该识别方法鲁棒性强，准确度高。本专利技术为解决现有问题的技术方案为：一种简易的印刷体数字识别方法，包括如下步骤：(一)数字检测为数字增加一个合作的方框将数字包围起来，数字外框与数字的高度之比为2:1，宽度之比为3:1，数字内外框的厚度为外框宽度的1/6，其中数字与外框为黑色白底；检测算法的具体流程如下：(1)通过图像采集得到RGB图像，由公式(1)得到图像亮度Y...

【技术保护点】
1.一种简易的印刷体数字识别方法，其特征在于，包括如下步骤：(一)数字检测为数字增加一个合作的方框将数字包围起来，数字外框与数字的高度之比为2:1，宽度之比为3:1，数字内外框的厚度为外框宽度的1/6，其中数字与外框为黑色白底；检测算法的具体流程如下：(1)通过图像采集得到RGB图像，由公式(1)得到图像亮度Y＝((R*299)+(G*587)+(B*114))/100 (1)设定固定阈值为150，对图像亮度做二值化处理；(2)利用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域；(3)由数字框的最左、最右、最上以及最下点确定方框的四个角点，相邻位置连线的斜率表示方框旋转的角度，对截取到的数字图像做旋转矫正；(二)数字分类数字分类的算法流程为：(1)根据上述步骤获得的旋转矫正后的数字图像，得到数字的最小外接矩形，计算在矩形方框内的竖直投影直方图，如果直方图中存在大于数字区域高度90％的值，则数字是1或4；(2)若数字不是1或4，在竖直1/2的位置获取数字的封闭特征矢量K1；若K1的维数是0，则该数字是0或8...

【技术特征摘要】
1.一种简易的印刷体数字识别方法，其特征在于，包括如下步骤：(一)数字检测为数字增加一个合作的方框将数字包围起来，数字外框与数字的高度之比为2:1，宽度之比为3:1，数字内外框的厚度为外框宽度的1/6，其中数字与外框为黑色白底；检测算法的具体流程如下：(1)通过图像采集得到RGB图像，由公式(1)得到图像亮度Y＝((R*299)+(G*587)+(B*114))/100(1)设定固定阈值为150，对图像亮度做二值化处理；(2)利用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域；(3)由数字框的最左、最右、最上以及最下点确定方框的四个角点，相邻位置连线的斜率表示方框旋转的角度，对截取到的数字图像做旋转矫正；(二)数字分类数字分类的算法流程为：(1)根据上述步骤获得的旋转矫正后的数字图像，得到数字的最小外接矩形，计算在矩形方框内的竖直投影直方图，如果直方图中存在大于数字区域高度90％的值，则数字是1或4；(2)若数字不是1或4，在竖直1/2的位置获取数字的封闭特征矢量K1；若K1的维数是0，则该数字是0或8；若K1的维数是1，则该数字是2、3、6、7或9；若K1的维数是2，则该数字是2或5；(3)对数字1和4的区分流程：水平1/3穿线得到交点个数，如果交点数大于3，则该数字是4，反之数字为1；(4)对数字0和8的区分流程：竖直1/3穿线得到交点个数，如果交点数大于6，则该数字是8，反之数字为0；(5)对数字2和5的区分流程：如果K1矢量为[2；1]，则该数字为2；如果K1矢量为[1；2]，则该数字为5；如果该矢量不是[2；1]或者[1；2]，则本次识别无效，返回数字-1；(6)对数字2、3、6、7和9的区分流程：如果K1矢量为[1]，则该数字为6；反之竖直3/5位置获取数字的封闭特征K2，若K2的维...

【专利技术属性】
技术研发人员：魏祥灰，王彪，姚振楠，唐超颖，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人