一种基于DS证据理论的单一字符图像匹配识别方法技术

技术编号:36288962 阅读:44 留言:0更新日期:2023-01-13 10:01
本发明专利技术公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:将待识别的单一字符图像A经灰度、二值化、边缘切割和缩放转化,得到图像E;采用圆周扫描和隔行展开两种方式分别得到字符样本库中各字符样本特征向量S1

【技术实现步骤摘要】
一种基于DS证据理论的单一字符图像匹配识别方法


[0001]本专利技术涉及计算机视觉与图像识别
,具体涉及一种基于DS证据理论的单一字符图像匹配识别方法。

技术介绍

[0002]随着可见光、红外、雷达等各种传感器的广泛部署应用,各类专用业务系统产生了大量图像数据;另外,得益于移动互联网的普及,图像数据的生成速度也在加快。面对堆积如山的视频和照片,单一依赖人工进行图像识别的途径显然已经力不从心,必须借助计算机视觉与图像处理技术,进行自动化图像识别。字符识别是图像识别的重要内容之一,旨在采用智能化手段,对一幅图像中的最具代表性的字符特征进行提取、识别,进而达到对图像中的物体进行个体身份识别的目的;字符识别技术在智能交通管理、军事侦察和卫星影像数据处理等方面具有广泛的应用需求。
[0003]字符识别过程一般包括图像预处理、字符图像定位、字符图像分割和字符图像匹配识别四个步骤。针对字符图像分割(第三步骤)后得到的单一字符图片,传统采用待识别字符与标准字符库进行逐一图像矩阵比较,选择差异最小的作为匹配识别结果的字符图像匹配识别(第四步骤)方法。传统方法对质量较好、扰动较小的字符图片的识别成功率较高,但对于质量较差、扰动较大的字符图片很难正确识别,很难达到人眼识别的准确度;而且当字符图片尺寸增大时,图像矩阵比较成倍增加了计算量,使得识别效率降低。

技术实现思路

[0004]针对现有技术中存在的上述问题,本专利技术提供一种基于DS证据理论的单一字符图像匹配识别方法,其在智能交通管理、军事侦察和卫星影像数据处理等方面具有广阔应用前景。
[0005]本专利技术公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:
[0006]对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1
ii
和S2
ii
,得到字符样本特征向量组S1和S2;其中,S1={S1
ii
,ii=1,2,

LEN}和S2={S2
ii
,ii=1,2,

LEN},LEN为字符样本库中字符样本图像的总数;
[0007]将待识别的单一字符图像A转化为灰度图像B,将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;将图像D缩放为M行N列像素大小,得到图像E;
[0008]采用圆周扫描和隔行展开两种方式分别得到图像E的待识别字符特征向量w1和w2;
[0009]分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1
ii
、待识别字符特征向量w2与每一个字符样本特征向量S2
ii
的欧式距离,得到距离序列F1和F2;
[0010]分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;
求样本集合H1和H2的并集,得到备选字符集合H;
[0011]以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;
[0012]基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PH
jj
,得到融合匹配概率序列PH;
[0013]取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果。
[0014]作为本专利技术的进一步改进,对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1
ii
和S2
ii
,得到字符样本特征向量组S1和S2;具体包括:
[0015]构建字符样本库;其中,字符样本库是专用业务系统中可能出现的字符全集的标准化数据和全集中某些字符的若干典型采样数据的集合,这些数据以文件方式存放在某个专用目录下;标准化数据是指包含特定字符集并以规定字型表示的字符图像数据;例如:飞机尾部侧翼喷涂的飞机编号由1个字母和4位数字组成,其特定字符集是不超过26个字母(A~Z)和10个数字(0~9)的集合,以黑体字型图片作为标准化数据。通常基于专用图像采集设备、特定拍摄场景和相同图像预处理过程多次采样得到的某个字符图像相似性很高,具有代表性,任选其中一个作为典型采样数据。某个字符的典型采样数据与其标准化数据会有一定差异,将典型采样数据也以图片文件方式加入到字符样本库中。某个字符样本图片文件的格式、大小、颜色无强制性要求,但主文件名首位必须是该字符,对于同一字符样本存在多个对应数据的,从主文件名第二位开始以数字加以区分。如:京.jpg,京1.jpg,京0.jpg,京01.jpg等等,均表示字符“京”的样本;
[0016]令ii=1,读取字符样本库中第ii个字符样本图像a;
[0017]将字符样本图像a转化为灰度图像b;
[0018]将灰度图像b转化为二值图像c;
[0019]对二值图像c的边缘进行切割,去除空白区域,得到图像d;
[0020]将图像d缩放为M行N列像素大小,得到图像e;
[0021]以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1的数量,得到LL1行1列的字符样本特征向量S1
ii

[0022]将图像e构成的像素矩阵隔行展开,得到LL2行1列的字符样本特征向量S2
ii
;其中,LL2=N*M/2;
[0023]令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S1={S1
ii
,ii=1,2,

LEN}和S2={S2
ii
,ii=1,2,

LEN}。
[0024]作为本专利技术的进一步改进,
[0025]将灰度图像B转化为二值图像C,具体包括:
[0026]取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;
[0027]计算阀值并取整;
[0028]遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0

1二值图像C;
[0029]或,
[0030]将灰度图像b转化为二值图像c,具体包括:
[0031]取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;
[0032]计算阀值并取整;
[0033]遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0

1二值图像c。
[0034]作为本专利技术的进一步改进,
[0035]对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DS证据理论的单一字符图像匹配识别方法,其特征在于,包括:对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1
ii
和S2
ii
,得到字符样本特征向量组S1和S2;其中,S1={S1
ii
,ii=1,2,

LEN}和S2={S2
ii
,ii=1,2,

LEN},LEN为字符样本库中字符样本图像的总数;将待识别的单一字符图像A转化为灰度图像B,将灰度图像B转化为二值图像C;对二值图像C的边缘进行切割,去除空白区域,得到图像D;将图像D缩放为M行N列像素大小,得到图像E;采用圆周扫描和隔行展开两种方式分别得到图像E的待识别字符特征向量w1和w2;分别逐一计算待识别字符特征向量w1与每一个字符样本特征向量S1
ii
、待识别字符特征向量w2与每一个字符样本特征向量S2
ii
的欧式距离,得到距离序列F1和F2;分别选取距离序列F1和F2中较小的n个值对应的字符样本,得到样本集合H1和H2;求样本集合H1和H2的并集,得到备选字符集合H;以备选字符集合H中每一个元素值为下标,分别取距离序列F1和F2中的对应值,构成备选字符距离序列P1和P2;根据备选字符距离序列P1和P2分别计算备选字符集合H中每个字符元素的基本匹配概率,得到基本概率序列Q1和Q2;基于DS证据理论,通过基本概率序列Q1和Q2计算归一化系数K;按照Dempster合成规则,计算备选字符集合H中每一个字符元素的DS融合匹配概率PH
jj
,得到融合匹配概率序列PH;取融合匹配概率序列PH中融合匹配概率最大的字符元素,作为待识别的单一字符图像A的匹配结果。2.如权利要求1所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,对字符样本库中的所有字符样本图像进行处理,采用圆周扫描和隔行展开两种方式分别提取字符样本特征向量S1
ii
和S2
ii
,得到字符样本特征向量组S1和S2;具体包括:构建字符样本库;其中,所述字符样本库包括对应业务系统可能出现的字符全集的标准化数据以及全集中某些字符的若干典型采样数据,标准化数据和典型采样数据共同作为字符样本图像,主文件名首位为该字符、从主文件名第二位开始以数字加以区分同一字符的不同样本图像;令ii=1,读取字符样本库中第ii个字符样本图像a;将字符样本图像a转化为灰度图像b;将灰度图像b转化为二值图像c;对二值图像c的边缘进行切割,去除空白区域,得到图像d;将图像d缩放为M行N列像素大小,得到图像e;以图像e的中心点为圆心,以1度为步长进行圆周扫描,分别统计每个步长上的像素值为1的数量,得到LL1行1列的字符样本特征向量S1
ii
;将图像e构成的像素矩阵隔行展开,得到LL2行1列的字符样本特征向量S2
ii
;令ii=ii+1,重复上述操作,直至ii=LEN,输出字符样本特征向量组S1={S1
ii
,ii=1,2,

LEN}和S2={S2
ii
,ii=1,2,

LEN}。3.如权利要求1或2所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,
将灰度图像B转化为二值图像C,具体包括:取灰度图像B中像素值的最大值和最小值,分别记为B_max和B_min;计算阀值并取整;遍历灰度图像B中的所有像素点,将像素值大于或等于阀值BT的赋值为1,否则赋值为0,得到0

1二值图像C;或,将灰度图像b转化为二值图像c,具体包括:取灰度图像b中像素值的最大值和最小值,分别记为g_max和g_min;计算阀值并取整;遍历灰度图像b中的所有像素,将像素值大于或等于阀值T的赋值为1,否则赋值为0,得到0

1二值图像c。4.如权利要求1或2所述的基于DS证据理论的单一字符图像匹配识别方法,其特征在于,对二值图像C的边缘进行切割,去除空白区域,得到图像D;具体包括:获得二值图像C的像素尺寸,包括:高度mC,宽度nC;令:top=1,bottom=mC,left=1,right=nC;若二值图像C的top行的像素值的和为0且top<=mC时,则一直执行top=top+1;若二值图像C的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom

1;若二值图像C的left列的像素值的和为0且left<nC时,则一直执行left=left+1;若二值图像C的right列的像素值的和为0且right>=1时,则一直执行right=right

1;按照左上点坐标(left,top),高度hD=bottom

top,宽度wD=right

left,裁剪二值图像C,得到边缘切割后的图像D;或,对二值图像c的边缘进行切割,去除空白区域,得到图像d;具体包括:获得二值图像c的像素尺寸,包括:高度mc,宽度nc;令:top=1,bottom=mc,left=1,right=nc;若二值图像c的top行的像素值的和为0且top<=mc时,则一直执行top=top+1;若二值图像c的bottom行的像素值的和为0且bottom>1时,则一直执行bottom=bottom

1;若二值图像c的left列的像素值的和为0且left<nc时,则一直执行left=left+1;若二值图像c的right列的像素值的和为0且right>=1时,则一直执行right=right

1;按照左上点坐标(left,top),...

【专利技术属性】
技术研发人员:高天睿齐伟华李红亮
申请(专利权)人:神州数码系统集成服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1