一种基于模板匹配的出版物印刷体数字识别方法技术

技术编号:34357746 阅读:18 留言:0更新日期:2022-07-31 06:55
本发明专利技术公开了一种基于模板匹配的出版物印刷体数字识别方法,属于图像处理技术领域;包括以下步骤:预设多个含不同数字的模板图层;获取待识别的数字图像;获取与该加权单图层上数字相匹配的多个待选模板图层;获取每个加权单图层上数字的位置特征集合和笔画粗细特征集合;判断获取与该加权单图层上数字匹配的待选模板图层,根据匹配的待选模板图层获取该加权单图层上数字信息;依次类比识别出数字图像中每个数字的信息。本发明专利技术通过对模板图像中数字区域内的像素值进行加权,改进基于模板匹配的数字识别算法,提高出版物印刷体数字识别的效率和准确率。别的效率和准确率。别的效率和准确率。

【技术实现步骤摘要】
一种基于模板匹配的出版物印刷体数字识别方法


[0001]本专利技术涉及图像处理
,具体涉及一种基于模板匹配的出版物印刷体数字识别方法。

技术介绍

[0002]印刷体数字识别一直是模式识别领域的研究热点。随着当今社会信息化的快速发展,我们正被数字化时代围绕着,数字正朝着替代我们对话和文字语言表达、记忆的方向进展。手机号码、驾驶证号码、身份证号码和体检表中,一系列表达出身份、能力、对象和健康质量的数字信息表示,都需要用计算机解读的阿拉伯数字0至9的组合来表达。
[0003]因此,针对这类问题的处理系统设计的关键之一就是设计出高可靠性和高识别率的数字识别方法。然而,现有技术中没有哪个数字识别方法能够达到完美的识别效果。传统的匹配算法计算量大,计算较复杂,匹配效率不高;像场中景物的平均灰度值的变化会影响匹配结果的正确性,对于像场中景物的方位旋转和尺度缩放的不适应性。

技术实现思路

[0004]本专利技术提供一种基于模板匹配的出版物印刷体数字识别方法,该方法通过对模板图像中数字区域内的像素值进行加权,改进基于模板匹配的数字识别算法,提高出版物印刷体数字识别的效率和准确率。
[0005]本专利技术的目的是提供一种基于模板匹配的出版物印刷体数字识别方法,包括以下步骤:预设多个含不同数字的模板图层,其中,每个模板图层为二值图像,且尺寸均相等;获取待识别的数字图像,将数字图像中每个数字按其自身的连通域划分成多个第一单图层;将每个第一单图层进行归一化处理获得与模板图层等尺寸的多个第二单图层;其中,每个模板图层和第二单图层中,数字区域像素点灰度值均为1,背景区域像素点灰度值均为0;对每个模板图层沿水平方向对每个像素点进行遍历获取多个灰度值为1的连续排列的像素点序列;获取每个模板图层中每个像素点序列的步长及每个像素点序列中像素点的权值;根据每个像素点序列中像素点的权值对模板图层进行加权处理依次获取每个数字对应的加权模板图层;依次类比对每个第二单图层进行加权处理获取多个加权单图层;在每个加权模板图层上从上至下等间隔设置多条横线,分别统计每条横线与对应加权模板图层上数字的第一交点数量;依次类比获取每条横线与加权单图层上数字的第二交点数量;根据每条横线在一加权单图层上的第二交点数和在每个加权模板图层上的第一交点数量,获取与该加权单图层上数字相匹配的多个待选模板图层;根据每个待选模板图层中每条横线对应待选模板图层上所有像素点的权值获取
每个待选模板图层上数字的位置特征集合;根据每个待选模板图层中每条横线对应的像素点序列的步长获取每个待选模板图层上数字的笔画粗细特征集合;依次类比获取每个加权单图层上数字的位置特征集合和笔画粗细特征集合;根据一加权单图层上数字的位置特征集合和笔画粗细特征集合,与每个待选模板图层上数字的位置特征集合和笔画粗细特征集合,判断获取与该加权单图层上数字匹配的待选模板图层,根据匹配的待选模板图层获取该加权单图层上数字信息;依次类比识别出数字图像中每个数字的信息。
[0006]在一实施例中,每个像素点序列的步长及每个像素点序列中像素点的权值具体按照以下步骤获取的:统计每个像素点序列中像素点的数量获取每个像素点序列的长度;设每个像素点序列的两端像素点至中心像素点的权值变化均为等差数列,设每个像素点序列中每个像素点权值的和为1,并设每个像素点序列的两端像素点的初始权值均为,其中,N为模板图层的横向长度;根据每个像素点序列的长度及对应两端像素点的初始权值获取每个像素点序列的步长;再根据每个像素点序列的步长和对应两端像素点的初始权值获取每个像素点序列中像素点的权值。
[0007]在一实施例中,获取与该加权单图层上数字相匹配的多个待选模板图层过程中,若获取一个待选模板图层,则根据该待选模板图层获取该加权单图层上数字信息。
[0008]在一实施例中,所述与该加权单图层上数字相匹配的多个待选模板图层是按照以下步骤获取:获取每条横线在一加权单图层上的位置及在该位置处与加权单图层上数字的第二交点数量;及获取在加权单图层上同样位置的横线与加权模板图层上数字的第一交点数量;根据每条横线在一加权单图层上的位置及在该位置处与加权单图层上数字的第一交点数量,和在加权单图层上同样位置的横线与加权模板图层上数字的第二交点数量的差值判断与该加权单图层上数字相匹配的多个加权模板图层,即为多个待选加权模板图层。
[0009]在一实施例中,所述判断与该加权单图层上数字相匹配的多个加权模板图层的计算公式如下:式中,表示在加权单图层上的第个横线与该加权单图层上数字的第二交点数量;表示在加权模板图层上的第个横线与该加权模板图层上数字的第一交点数量;
表示每条横线在加权单图层上数字的第一交点数量,和在加权单图层上同样位置的横线与加权模板图层上数字的第二交点数量的差值;当,则判断加权单图层上数字与加权模板图层上的数字不匹配;当,则判断加权单图层上数字与加权模板图层上的数字匹配,依次获取与加权单图层上数字相匹配的多个加权模板图层,即为多个待选加权模板图层。
[0010]在一实施例中,所述每个待选模板图层上数字的位置特征集合是按照以下步骤获取:根据每个待选模板图层中每条横线对应待选模板图层上所有像素点的权值,按照横线在待选模板图层中从上至下的顺序,依次将每条横线对应于待选模板图层上所有像素点的权值排列获取位置特征集合,即为,其中,N表示待选模板图层的横向长度。
[0011]在一实施例中,所述每个待选模板图层上数字的笔画粗细特征集合是按照以下步骤获取:根据每个待选模板图层中每条横线对应的像素点序列的步长,按照横线在待选模板图层中从上至下的顺序,依次将每条横线对应的像素点序列的步长排列获取笔画粗细特征集合,即为,其中,表示所有横线在待选模板图层上交点总数量。
[0012]在一实施例中,判断获取与该加权单图层上数字匹配的待选模板图层过程中,是根据一加权单图层上数字的位置特征集合与每个待选模板图层上数字的位置特征集合中对应位置的数值差值,及该加权单图层上数字的笔画粗细特征集合与每个待选模板图层上数字的笔画粗细特征集合中对应位置的数值差值,判断与该加权单图层上数字匹配的待选模板图层。
[0013]在一实施例中,判断与该加权单图层上数字匹配的待选模板图层的计算公式如下:式中,表示加权单图层对应的位置特征集合;表示待选模板图层对应的位置特征集合,;表示在加权单图层对应的位置特征集合和待选模板图层对应的位置特征集合中第个数值的差值绝对值;表示加权单图层对应的笔画粗细特征集合;表示待选模板图层对应的笔画粗细特征集合,;
表示在加权单图层对应的笔画粗细特征集合和待选模板图层对应的笔画粗细特征集合中第个数值的差值绝对值;表示加权单图层上数字与待选模板图层上数字匹配误差值;获取可容许的误差分量;当时,则判断加权单图层上数字与待选加权模板图层上的数字匹配,当时,则判断加权单图层上数字与待选加权模板图层上的数字不匹配,其中,所述可容许的误差分量是通过已知正确匹配的加权单图层上数字与待选加权模板图层上的数字,计算值而获取的可容许的误本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模板匹配的出版物印刷体数字识别方法,其特征在于,包括以下步骤:预设多个含不同数字的模板图层,其中,每个模板图层为二值图像,且尺寸均相等;获取待识别的数字图像,将数字图像中每个数字按其自身的连通域划分成多个第一单图层;将每个第一单图层进行归一化处理获得与模板图层等尺寸的多个第二单图层;其中,每个模板图层和第二单图层中,数字区域像素点灰度值均为1,背景区域像素点灰度值均为0;对每个模板图层沿水平方向对每个像素点进行遍历获取多个灰度值为1的连续排列的像素点序列;获取每个模板图层中每个像素点序列的步长及每个像素点序列中像素点的权值;根据每个像素点序列中像素点的权值对模板图层进行加权处理依次获取每个数字对应的加权模板图层;依次类比对每个第二单图层进行加权处理获取多个加权单图层;在每个加权模板图层上从上至下等间隔设置多条横线,分别统计每条横线与对应加权模板图层上数字的第一交点数量;依次类比获取每条横线与加权单图层上数字的第二交点数量;根据每条横线在一加权单图层上的第二交点数和在每个加权模板图层上的第一交点数量,获取与该加权单图层上数字相匹配的多个待选模板图层;根据每个待选模板图层中每条横线对应待选模板图层上所有像素点的权值获取每个待选模板图层上数字的位置特征集合;根据每个待选模板图层中每条横线对应的像素点序列的步长获取每个待选模板图层上数字的笔画粗细特征集合;依次类比获取每个加权单图层上数字的位置特征集合和笔画粗细特征集合;根据一加权单图层上数字的位置特征集合和笔画粗细特征集合,与每个待选模板图层上数字的位置特征集合和笔画粗细特征集合,判断获取与该加权单图层上数字匹配的待选模板图层,根据匹配的待选模板图层获取该加权单图层上数字信息;依次类比识别出数字图像中每个数字的信息。2.根据权利要求1所述的基于模板匹配的出版物印刷体数字识别方法,其特征在于,每个像素点序列的步长及每个像素点序列中像素点的权值具体按照以下步骤获取的:统计每个像素点序列中像素点的数量获取每个像素点序列的长度;设每个像素点序列的两端像素点至中心像素点的权值变化均为等差数列,设每个像素点序列中每个像素点权值的和为1,并设每个像素点序列的两端像素点的初始权值均为,其中,N为模板图层的横向长度;根据每个像素点序列的长度及对应两端像素点的初始权值获取每个像素点序列的步长;再根据每个像素点序列的步长和对应两端像素点的初始权值获取每个像素点序列中像素点的权值。3.根据权利要求1所述的基于模板匹配的出版物印刷体数字识别方法,其特征在于,获取与该加权单图层上数字相匹配的多个待选模板图层过程中,若获取一个待选模板图层,则根据该待选模板图层获取该加权单图层上数字信息。4.根据权利要求1所述的基于模板匹配的出版物印刷体数字识别方法,其特征在于,所述与该加权单图层上数字相匹配的多个待选模板图层是按照以下步骤获取:
获取每条横线在一加权单图层上的位置及在该位置处与加权单图层上数字的第二交点数量;及获取在加权单图层上同样位置的横线与加权模板图层上数字的第一交点数量;根据每条横线在一加权单图层上的位置及在该位置处与加权单图层上数字的第一交点数量,和在加权单图层上同样位置的横线与加权模板图层上数字的第二交点数量的差值判断与该加权单图层上数字相匹配的多个加权模板图层,即为多个待选加权模板图层。5.根据权利...

【专利技术属性】
技术研发人员:王艳彬孙宪景郑博
申请(专利权)人:山东蓝彩天下教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1