一种基于金字塔特征的单一字符图像匹配识别方法技术

技术编号:36252764 阅读:11 留言:0更新日期:2023-01-07 09:46
本发明专利技术公开了一种基于金字塔特征的单一字符图像匹配识别方法,包括:将待识别的单一字符图像A经灰度、二值化、边缘切割、缩放转换,得到图像E;提取字符样本库中的每个字符样本图像的lev层金字塔特征以及图像E的lev层金字塔特征,得到大小为n行1列的字符样本特征向量S

【技术实现步骤摘要】
一种基于金字塔特征的单一字符图像匹配识别方法


[0001]本专利技术涉及计算机视觉与图像识别
,具体涉及一种基于金字塔特征的单一字符图像匹配识别方法。

技术介绍

[0002]随着可见光、红外、雷达等各种传感器的广泛部署应用,各类专用业务系统产生了大量图像数据;另外,得益于移动互联网的普及,图像数据的生成速度也在加快。面对堆积如山的视频和照片,单一依赖人工进行图像识别的途径显然已经力不从心,必须借助计算机视觉与图像处理技术,进行自动化图像识别。字符识别是图像识别的重要内容之一,旨在采用智能化手段,对一幅图像中的最具代表性的字符特征进行提取、识别,进而达到对图像中的物体进行个体身份识别的目的;字符识别技术在智能交通管理、军事侦察和卫星影像数据处理等方面具有广泛的应用需求。
[0003]字符识别过程一般包括图像预处理、字符图像定位、字符图像分割和字符图像匹配识别四个步骤。针对字符图像分割(第三步骤)后得到的单一字符图片,传统采用待识别字符与标准字符库进行逐一图像矩阵比较,选择差异最小的作为匹配识别结果的字符图像匹配识别(第四步骤)方法。传统方法对质量较好、扰动较小的字符图片的识别成功率较高,但对于质量较差、扰动较大的字符图片很难正确识别,很难达到人眼识别的准确度;而且当字符图片尺寸增大时,图像矩阵比较成倍增加了计算量,使得识别效率降低。

技术实现思路

[0004]针对现有技术中存在的上述问题,本专利技术提供一种基于金字塔特征的单一字符图像匹配识别方法,其在智能交通管理、军事侦察和卫星影像数据处理等方面具有广阔应用前景;其中,本专利技术所基于的图像金字塔是一种采用多种分辨率表达图像的结构形式,金字塔底部是高分辨率的原始图像,顶部是低分辨率的近似图像,当从底部向金字塔上层移动时,各层近似图像的尺寸和分辨率就会随之降低。
[0005]本专利技术公开了一种基于金字塔特征的单一字符图像匹配识别方法,包括:
[0006]提取字符样本库中的每个字符样本图像的lev层金字塔特征,得到字符样本特征向量组S;其中,S={S
ii
,ii=1,2,

LEN},S
ii
为第ii个字符样本特征向量,LEN为字符样本库中字符样本图像的总数;
[0007]将待识别的单一字符图像A转化为灰度图像B;
[0008]将灰度图像B转化为二值图像C;
[0009]对二值图像C的边缘进行切割,去除空白区域,得到图像D;
[0010]将图像D缩放为M行N列像素大小,得到图像E;
[0011]提取图像E的lev层金字塔特征,得到大小为n行1列的待识别字符特征向量W;
[0012]逐一计算待识别字符特征向量W与每一个字符样本特征向量S
ii
的欧氏距离,得到距离统计量F;
[0013]计算距离统计量F的均值和均方差,判断欧氏距离最小的字符样本图像的欧氏距离与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功。
[0014]作为本专利技术的进一步改进,提取字符样本库中的每个字符样本图像的lev层金字塔特征,得到字符样本特征向量组S;具体包括:
[0015]构建字符样本库;其中,字符样本库是专用业务系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合,这些数据以文件方式存放在某个专用目录下;标准化数据是指包含特定字符集并以规定字型表示的字符图像数据;例如:飞机尾部侧翼喷涂的飞机编号由1个字母和4位数字组成,其特定字符集是不超过26个字母(A~Z)和10个数字(0~9)的集合,以黑体字型图片作为标准化数据。通常基于专用图像采集设备、特定拍摄场景和相同图像预处理过程多次采样得到的某个字符图像相似性很高,具有代表性,任选其中一个作为典型采样数据。某个字符的典型采样数据与其标准化数据会有一定差异,将典型采样数据也以图片文件方式加入到字符样本库中。某个字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分。如:京.jpg,京1.jpg,京0.jpg,京01.jpg等等,均表示字符“京”的样本;
[0016]令ii=1,读取字符样本库中第ii个字符样本图像a;
[0017]将字符样本图像a转化为灰度图像b;
[0018]将灰度图像b转化为二值图像c;
[0019]对二值图像c的边缘进行切割,去除空白区域,得到图像d;
[0020]将图像d缩放为M行N列像素大小,得到图像e;
[0021]提取图像e的lev层金字塔特征,得到大小为n行1列的字符样本特征向量S
ii

[0022]令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S={S
ii
,ii=1,2,

LEN}。
[0023]作为本专利技术的进一步改进,
[0024]将灰度图像B转化为二值图像C,具体包括:
[0025]取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;
[0026]计算阀值并取整;
[0027]遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0

1二值图像C;
[0028]或,
[0029]将灰度图像b转化为二值图像c,具体包括:
[0030]取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
[0031]计算阀值并取整;
[0032]遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0

1二值图像c。
[0033]作为本专利技术的进一步改进,
[0034]对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:
[0035]获得二值图像C的像素尺寸,包括:高度mC,宽度nC;
[0036]令:top=1,bottom=mC,left=1,right=nC;
[0037]若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;
[0038]若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom

1;
[0039]若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;
[0040]若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right

1;
[0041]按照左上点坐标(left,top),高度hD=bottom

top,宽度wD=right
...

【技术保护点】

【技术特征摘要】
1.一种基于金字塔特征的单一字符图像匹配识别方法,其特征在于,包括:提取字符样本库中的每个字符样本图像的lev层金字塔特征,得到字符样本特征向量组S;其中,S={S
ii
,ii=1,2,

LEN},S
ii
为第ii个字符样本特征向量,LEN为字符样本库中字符样本图像的总数;将待识别的单一字符图像A转化为灰度图像B;将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;将图像D缩放为M行N列像素大小,得到图像E;提取图像E的lev层金字塔特征,得到大小为n行1列的待识别字符特征向量W;逐一计算待识别字符特征向量W与每一个字符样本特征向量S
ii
的欧氏距离,得到距离统计量F;计算距离统计量F的均值和均方差,判断欧氏距离最小的字符样本图像的欧氏距离与均值的差是否小于负R倍均方差;若小于,则待识别的单一字符图像A匹配成功。2.如权利要求1所述的基于金字塔特征的单一字符图像匹配识别方法,其特征在于,提取字符样本库中的每个字符样本图像的lev层金字塔特征,得到字符样本特征向量组S;具体包括:构建字符样本库;其中,所述字符样本库包括对应业务系统可能出现的字符全集的标准化数据以及全集中某些字符的若干典型采样数据,标准化数据和典型采样数据共同作为字符样本图像,主文件名首位为该字符、从主文件名第二位开始以数字加以区分同一字符的不同样本图像;令ii=1,读取字符样本库中第ii个字符样本图像a;将字符样本图像a转化为灰度图像b;将灰度图像b转化为二值图像c;对二值图像c的边缘进行切割,去除空白区域,得到图像d;将图像d缩放为M行N列像素大小,得到图像e;提取图像e的lev层金字塔特征,得到大小为n行1列的字符样本特征向量S
ii
;令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S={S
ii
,ii=1,2,

LEN}。3.如权利要求1或2所述的基于金字塔特征的单一字符图像匹配识别方法,其特征在于,将灰度图像B转化为二值图像C,具体包括:取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;计算阀值并取整;遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0

1二值图像C;或,将灰度图像b转化为二值图像c,具体包括:取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
计算阀值并取整;遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0

1二值图像c。4.如权利要求1或2所述的基于金字塔特征的单一字符图像匹配识别方法,其特征在于,对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:获得二值图像C的像素尺寸,包括:高度mC,宽度nC;令:top=1,bottom=mC,left=1,right=nC;若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom

1;若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right

1;按照左上点坐标(left,top),高度hD=bottom

top,宽度wD=right

left,裁剪二值图像C,得到边缘切割后的图像D;或,对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:获得二值图像c的像素尺寸,包括:高度mc,宽度nc;令:top=1,bottom=mc,left=1,right=nc;若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom

1;若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right

1;按照左上点坐标(left,top),高度hd=bottom

top,宽度wd=right

left,裁剪二值图像c,得到边缘切割后的图像d。5.如权利要求1或2所述的基于金字塔特征的单一字符图像匹配识别方法,其特征在于,采用最近邻域插值法将图像D缩放为M行N列像素...

【专利技术属性】
技术研发人员:高天睿韩世宁赵俊明
申请(专利权)人:神州数码系统集成服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1