一种简易的印刷体数字识别方法技术

技术编号:18972758 阅读:30 留言:0更新日期:2018-09-19 03:47
本发明专利技术提供了一种简易的印刷体数字识别方法,属于图像处理技术领域。该方法包括数字检测、数字分类以及决策机制三部分:首先,获取数字图像,以亮度、区域面积、长宽比为特征检测数字区域;然后,根据获得的数字区域,利用数字的封闭特性、直方图特性将其粗分类为四部分,结合数字的穿线特征、局部直方图特征以及局部封闭性特征再对其进行细分类,进而识别各数字;最后,利用滤波与状态机结合的决策机制,提高数字识别的准确度,达到准确识别数字的目的。本发明专利技术通过设计分类决策树与决策机制并应用数字框,提高识别的准确性和鲁棒性,实现简易而准确的印刷体数字识别方法,具有很大的实用价值。

A simple method for recognition of printed numerals

The invention provides a simple printing digit recognition method, which belongs to the field of image processing technology. The method consists of three parts: first, the digital image is acquired and the digital region is detected by brightness, area and aspect ratio; then, according to the obtained digital region, the digital region is roughly classified into four parts by using the characteristics of digital enclosure and histogram. The line feature, the local histogram feature and the local closure feature are subdivided and classified to recognize the digits. Finally, the decision-making mechanism of combining filtering and state machine is used to improve the accuracy of digital recognition and achieve the purpose of identifying the digits accurately. The invention improves the accuracy and robustness of recognition by designing classification decision tree and decision mechanism and applying digital frame, realizes simple and accurate printed numeral recognition method, and has great practical value.

【技术实现步骤摘要】
一种简易的印刷体数字识别方法
本专利技术涉及一种简易的印刷体数字识别方法,属于图像处理

技术介绍
如今对印刷体数字的识别已经得到了广泛的应用,如何简单、高效且准确地实现印刷体数字的识别是目前各种印刷体数字识别方法接下来面临的挑战。现有的印刷体数字识别方法主要有三类:基于模版匹配的数字识别方法、基于人工神经网络的数字识别方法以及基于特征分析的数字识别方法。传统的识别方法是模板匹配,该方法的主要问题在于计算量大、对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感;基于人工神经网络的数字识别方法是当前最为流行的方法,该方法适用于环境复杂、难以提取特征的情况,对处理器要求较高,需要较大的存储空间以及运行内存,不适用于印刷体数字的识别问题;基于特征分析的方法通过提取号码图像中的具有代表性的特征达到识别该数字的目的,当前研究中的数字特征主要有:焦点特征、封闭半封闭特征、横竖直线特征、投影特征以及分区面积特征等等,但是这些特征鲁棒性不够,受数字字体、倾斜度等因素影响程度不一,直接影响到实际应用中数字识别的准确率。
技术实现思路
为解决现有技术存在的问题,本专利技术提出一种简易的印刷体数字识别方法,该识别方法鲁棒性强,准确度高。本专利技术为解决现有问题的技术方案为:一种简易的印刷体数字识别方法,包括如下步骤:(一)数字检测为数字增加一个合作的方框将数字包围起来,数字外框与数字的高度之比为2:1,宽度之比为3:1,数字内外框的厚度为外框宽度的1/6,其中数字与外框为黑色白底;检测算法的具体流程如下:(1)通过图像采集得到RGB图像,由公式(1)得到图像亮度Y=((R*299)+(G*587)+(B*114))/100(1)设定固定阈值为150,对图像亮度做二值化处理;(2)利用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域;(3)由数字框的最左、最右、最上以及最下点确定方框的四个角点,相邻位置连线的斜率表示方框旋转的角度,对截取到的数字图像做旋转矫正;(二)数字分类数字分类的算法流程为:(1)根据上述步骤获得的旋转矫正后的数字图像,得到数字的最小外接矩形,计算在矩形方框内的竖直投影直方图,如果直方图中存在大于数字区域高度90%的值,则数字是1或4;(2)若数字不是1或4,在竖直1/2的位置获取数字的封闭特征矢量K1,若K1的维数是0,则该数字是0或8;若K1的维数是1,则该数字是2、3、6、7或9;若K1的维数是2,则该数字是2或5;(3)对数字1和4的区分流程:水平1/3穿线得到交点个数,如果交点数大于3,则该数字是4,反之数字为1;(4)对数字0和8的区分流程:竖直1/3穿线得到交点个数,如果交点数大于6,则该数字是8,反之数字为0;(5)对数字2和5的区分流程:如果K1矢量为[2;1],则该数字为2;如果K1矢量为[1;2],则该数字为5;如果该矢量不是[2;1]或者[1;2],则本次识别无效,返回数字-1;(6)对数字2、3、6、7和9的区分流程:如果K1矢量为[1],则该数字为6;反之竖直3/5位置获取数字的封闭特征K2,若K2的维数是2,则该数字为2;反之计算外接矩形框1/4左上角方框内数字像素的水平投影直方图,若直方图中为0的最大连续区域占高度的比值小于18%,则该数字是9;反之计算外接矩形框1/2下部方框内数字像素的竖直投影直方图,若直方图中为0的最大连续区域占宽度的比值小于18%,则该数字是3;反之数字是7;(三)决策机制滤波与状态机结合的数字识别决策机制,具体为:信号滤波进入初始状态,读入视频流后,由数字分类算法得到一串分类结果,例如:“2,2,2,2,2,2,3,2,2,3,3,3,2,2,2,2”,分析到其中3是数字误识别的结果,图像中的数字应该是2;经过中值滤波器,得到滤波后的结果为“2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2”,提高了数字识别率,进入决策机制的初始状态为S0=2;基于状态机的切换机制:设现态为S0=m,即当前输出结果为m,0≤m≤9;次态S1=n,即可能切换到的状态,输出结果为n,0≤n≤9且m≠n;由决策时刻得到的最新五个分类结果做成的矩阵H=[h1,h2,h3,h4,h5],作为状态转换的条件函数。状态由S0切换到S1之后,则S1为现态,S0为次态。更进一步地,步骤二中获取数字封闭特征矢量的具体方式为:在数字区域宽度的1/2或者3/5的位置做一条竖线,对竖线上每一个点判断其左右两侧的开闭性,如果某一点所在行的左侧没有数字区域,则定义为左开性,反之为左闭性;如果某一点所在行的右侧没有数字区域,则定义为右开性,反之为右闭性;针对该点的开闭性,右开左闭设为1,左开右闭设为2,左开右开设为3,左闭右闭设为0,如此即可得到该竖线上所有的点开闭性组成的矢量K;为提高算法的鲁棒性,对矢量K化简,规定左闭右闭的0不记录,竖线上相邻位置的开闭性如果一直,则只计一次,化简后得到数字封闭特征矢量K1或者K2。与现有技术相比,本专利技术的有益效果在于:本专利技术中数字框的设计,有益于数字在复杂环境中的准确定位,同时给数字的倾斜程度提供参考,减小识别中数字倾斜对特征提取的影响,提高检测的准确性;滤波与状态机结合的数字识别决策机制的使用降低了检测和分类中干扰因素的影响,有效应对分类后仍有某些数字识别不准确的情况,结合数字分类算法简单、处理速度快的优点,大大提高了数字识别的鲁棒性、准确度和效率,因而具有非常大的实用价值。附图说明图1为本专利技术的数字识别方法流程图;图2为本专利技术的数字框示意图;图3为图像采集原始图;图4为图3二值化处理的结果;图5为图4区域筛选结果;图6为图5旋转矫正结果;图7为本专利技术的数字分类算法流程图;图8为本专利技术区分数字1和4的算法流程图;图9为本专利技术区分数字0和8的算法流程图;图10为本专利技术区分数字2和5的算法流程图;图11为本专利技术区分数字2、3、6、7和9的算法流程图;图12为本专利技术的水平1/3穿线示意图;图13为本专利技术的水平投影直方图示意图;图14为本专利技术的1/4左上角方框示意图;图15为本专利技术的1/2下部方框示意图;图16为本专利技术的状态转换机制原理图;图17为数字识别结果示例一;图18为数字识别结果示例二;图19为数字识别结果示例三;图20为数字识别结果示例四;其中,图17至图20中,T-数字识别任务号;N-识别到的结果;L-待定位数字;E-数字定位后的坐标位置。具体实施方式如图1所示,印刷体数字识别方法主要由数字检测、数字分类以及决策机制三个步骤组成,具体为:(一)数字检测如图2所示,为数字增加一个合作的方框将数字包围起来,该合作的方框简称数字框;数字外框与数字的高度之比为2:1,宽度之比为3:1,数字内外框的厚度为外框宽度的1/6,其中数字与外框为黑色白底。检测算法的具体流程如下:(1)如图3所示,通过图像采集得到RGB原始图像,由公式(1)得到图像亮度Y=((R*299)+(G*587)+(B*114))/100(1)设定固定阈值为150,对图像亮度做二值化处理,处理结果如图4所示;(2)利用数字框与数字的面积比特征、几何关系特征(数字包含在数字框的内部)、数字和数字本文档来自技高网...

【技术保护点】
1.一种简易的印刷体数字识别方法,其特征在于,包括如下步骤:(一)数字检测为数字增加一个合作的方框将数字包围起来,数字外框与数字的高度之比为2:1,宽度之比为3:1,数字内外框的厚度为外框宽度的1/6,其中数字与外框为黑色白底;检测算法的具体流程如下:(1)通过图像采集得到RGB图像,由公式(1)得到图像亮度Y=((R*299)+(G*587)+(B*114))/100     (1)设定固定阈值为150,对图像亮度做二值化处理;(2)利用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域;(3)由数字框的最左、最右、最上以及最下点确定方框的四个角点,相邻位置连线的斜率表示方框旋转的角度,对截取到的数字图像做旋转矫正;(二)数字分类数字分类的算法流程为:(1)根据上述步骤获得的旋转矫正后的数字图像,得到数字的最小外接矩形,计算在矩形方框内的竖直投影直方图,如果直方图中存在大于数字区域高度90%的值,则数字是1或4;(2)若数字不是1或4,在竖直1/2的位置获取数字的封闭特征矢量K1;若K1的维数是0,则该数字是0或8;若K1的维数是1,则该数字是2、3、6、7或9;若K1的维数是2,则该数字是2或5;(3)对数字1和4的区分流程:水平1/3穿线得到交点个数,如果交点数大于3,则该数字是4,反之数字为1;(4)对数字0和8的区分流程:竖直1/3穿线得到交点个数,如果交点数大于6,则该数字是8,反之数字为0;(5)对数字2和5的区分流程:如果K1矢量为[2;1],则该数字为2;如果K1矢量为[1;2],则该数字为5;如果该矢量不是[2;1]或者[1;2],则本次识别无效,返回数字‑1;(6)对数字2、3、6、7和9的区分流程:如果K1矢量为[1],则该数字为6;反之竖直3/5位置获取数字的封闭特征K2,若K2的维数是2,则该数字为2;反之计算外接矩形框1/4左上角方框内数字像素的水平投影直方图,若直方图中为0的最大连续区域占高度的比值小于18%,则该数字是9;反之计算外接矩形框1/2下部方框内数字像素的竖直投影直方图,若直方图中为0的最大连续区域占宽度的比值小于18%,则该数字是3;反之数字是7;(三)决策机制滤波与状态机结合的数字识别决策机制,具体为:信号滤波进入初始状态,读入视频流后,由数字分类算法得到一串分类结果,例如:“2,2,2,2,2,2,3,2,2,3,3,3,2,2,2,2”,分析到其中3是数字误识别的结果,图像中的数字应该是2;经过中值滤波器,得到滤波后的结果为“2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2”,提高了数字识别率,进入决策机制的初始状态为S0=2;基于状态机的切换机制:设现态为S0=m,即当前输出结果为m,0≤m≤9;次态S1=n,即可能切换到的状态,输出结果为n,0≤n≤9且m≠n;由决策时刻得到的最新五个分类结果做成的矩阵H=[h1,h2,h3,h4,h5],作为状态转换的条件函数;状态由S0切换到S1之后,则S1为现态,S0为次态。...

【技术特征摘要】
1.一种简易的印刷体数字识别方法,其特征在于,包括如下步骤:(一)数字检测为数字增加一个合作的方框将数字包围起来,数字外框与数字的高度之比为2:1,宽度之比为3:1,数字内外框的厚度为外框宽度的1/6,其中数字与外框为黑色白底;检测算法的具体流程如下:(1)通过图像采集得到RGB图像,由公式(1)得到图像亮度Y=((R*299)+(G*587)+(B*114))/100(1)设定固定阈值为150,对图像亮度做二值化处理;(2)利用数字框与数字的面积比特征、几何关系特征以及数字和数字框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域;(3)由数字框的最左、最右、最上以及最下点确定方框的四个角点,相邻位置连线的斜率表示方框旋转的角度,对截取到的数字图像做旋转矫正;(二)数字分类数字分类的算法流程为:(1)根据上述步骤获得的旋转矫正后的数字图像,得到数字的最小外接矩形,计算在矩形方框内的竖直投影直方图,如果直方图中存在大于数字区域高度90%的值,则数字是1或4;(2)若数字不是1或4,在竖直1/2的位置获取数字的封闭特征矢量K1;若K1的维数是0,则该数字是0或8;若K1的维数是1,则该数字是2、3、6、7或9;若K1的维数是2,则该数字是2或5;(3)对数字1和4的区分流程:水平1/3穿线得到交点个数,如果交点数大于3,则该数字是4,反之数字为1;(4)对数字0和8的区分流程:竖直1/3穿线得到交点个数,如果交点数大于6,则该数字是8,反之数字为0;(5)对数字2和5的区分流程:如果K1矢量为[2;1],则该数字为2;如果K1矢量为[1;2],则该数字为5;如果该矢量不是[2;1]或者[1;2],则本次识别无效,返回数字-1;(6)对数字2、3、6、7和9的区分流程:如果K1矢量为[1],则该数字为6;反之竖直3/5位置获取数字的封闭特征K2,若K2的维...

【专利技术属性】
技术研发人员:魏祥灰王彪姚振楠唐超颖
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1