【技术实现步骤摘要】
本专利技术属于字符识别领域(简称OCR),涉及一致融合二值图像与灰度图像的字符 识别的方法。
技术介绍
传统的字符识别技术是基于字符的二值图像或者是基于字符的灰度图像。当基 于字符的二值图像的识别技术应用于各种低质量图像,比如视频中的退化字符图像、身份 证图像、汽车牌照、自然场景中的字符图像等低分辨率图像,由于二值化后的字符图像质量 低,识别效果差。当基于字符的灰度图像的识别技术应用于包含复杂背景的字符图像,比如 视频中的字符图像,由于字符图像包含非一致的背景,识别效果将变差。
技术实现思路
为了解决现有技术的问题,本专利技术的目的在于提供一种融合字符的二值图像与灰 度图像进行字符识别的方法。 为达成所述目的,本专利技术提供的,对所述二值图像与灰度图像的融合图像进行处理,进行字符识别,其包括以下步骤 步骤l :设预处理后得到的单个字符图像的二值图像为<formula>formula see original document page 6</formula>其中位于第x行第y列的像素点的值为b。(x, y) , b。(x, y)为0或1,图像的大小为W具;字符的灰度图像为<formula>formula see original document page 6</formula>位于第x行第y列的像素点的值为g。 (x, y) ,<formula>formula see original document page 6</formula>将字符图像的二值图像B。与灰度图像G。进行融合 ...
【技术保护点】
一种融合二值图像与灰度图像的字符识别的方法,其特征在于,对所述二值图像与灰度图像的融合图像进行处理,进行字符识别,其包括以下步骤:步骤1:设预处理后得到的单个字符图像的二值图像为B↓[0]=[b↓[0](x,y)],其中位于第x行第y列的像素点的值为b↓[0](x,y),b↓[0](x,y)为0或1,图像的大小为W↓[1]×H↓[1];字符的灰度图像为G↓[c]=[g↓[c](x,y)],位于第x行第y列的像素点的值为g↓[c](x,y),0≤g↓[c](x,y)≤255;将字符图像的二值图像B↓[0]与灰度图像G↓[c]进行融合,得融合后的图像G=[g(x,y)],位于第x行第y列的像素点的值为g(x,y),0≤g(x,y)≤255;步骤2:在提取融合图像G=[g(x,y)]的特征前,先进行融合图像G=[g(x,y)]的位置和大小的归一化处理;图像归一化处理的输入图像为G=[g(x,y)],归一化后的输出图像为F=[f(x’,y’)],其大小分别为W↓[1]×H↓[1]和W↓[2×]H↓[2];输入图像G=[g(x,y)]位于第x行第y列的像素点将被映射到F=[f(x’,y’)]位于 ...
【技术特征摘要】
一种融合二值图像与灰度图像的字符识别的方法,其特征在于,对所述二值图像与灰度图像的融合图像进行处理,进行字符识别,其包括以下步骤步骤1设预处理后得到的单个字符图像的二值图像为B0=[b0(x,y)],其中位于第x行第y列的像素点的值为b0(x,y),b0(x,y)为0或1,图像的大小为W1×H1;字符的灰度图像为Gc=[gc(x,y)],位于第x行第y列的像素点的值为gc(x,y),0≤gc(x,y)≤255;将字符图像的二值图像B0与灰度图像Gc进行融合,得融合后的图像G=[g(x,y)],位于第x行第y列的像素点的值为g(x,y),0≤g(x,y)≤255;步骤2在提取融合图像G=[g(x,y)]的特征前,先进行融合图像G=[g(x,y)]的位置和大小的归一化处理;图像归一化处理的输入图像为G=[g(x,y)],归一化后的输出图像为F=[f(x’,y’)],其大小分别为W1×H1和W2×H2;输入图像G=[g(x,y)]位于第x行第y列的像素点将被映射到F=[f(x’,y’)]位于第x’行第y’列的像素点,通过输入图像和输出图像的坐标映射来实现图像归一化 <mfenced open='{' close=''><mtable> <mtr><mtd> <msup><mi>x</mi><mo>′</mo> </msup> <mo>=</mo> <msup><mi>x</mi><mo>′</mo> </msup> <mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo> </mrow></mtd> </mtr> <mtr><mtd> <msup><mi>y</mi><mo>′</mo> </msup> <mo>=</mo> <msup><mi>y</mi><mo>′</mo> </msup> <mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo> </mrow></mtd> </mtr></mtable> </mfenced>一维坐标映射为 <mrow><mfenced open='{' close=''> <mtable><mtr> <mtd><msup> <mi>x</mi> <mo>′</mo></msup><mo>=</mo><msup> <mi>x</mi> <mo>′</mo></msup><mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo></mrow> </mtd></mtr><mtr> <mtd><msup> <mi>y</mi> <mo>′</mo></msup><mo>=</mo><msup> <mi>y</mi> <mo>′</mo></msup><mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo></mrow> </mtd></mtr> </mtable></mfenced><mo>;</mo> </mrow>步骤3基于梯度直方图提取归一化图像的梯度直方图的特征;步骤4利用主分量分析与线性判别分析对归一化图像的梯度直方图的特征进行降维处理,得到特征降维的变换矩阵;步骤5建立字符特征模板库,读取特征降维的变换矩阵并对字符进行识别。2. 根据权利要求1所述融合二值图像与灰度图像的字符识别的方法,其特征在于,所 述二值图像与灰度图像的融合包括步骤11 :对灰度图像G。 = [g。(x,y)]的像素点值g。(x,y)利用传统的最大类间方差法 求得阈值th。stu,求一个全局阈值th,令th = aX th。stu, a是一个常数;利用全值阈值th对灰 度图像G。二 [g。(x,y)]的像素点值g。(x,y)进行门限处理,得到二值图像Bg = [bg(x,y)], 二值图像的像素点值bg(x, y)定义为步骤12 :利用二值形态学对二值图像B。进行条件膨胀,设D是一个3X3的图像,其每 个位置的像素值为1 ;对二值图像B。进行条件膨胀为A+, 二C8(十D)r^g,l,2,-,A^ 二^根据上式对二值图像Bi反复进行条件膨胀,直到Bi+1 = Bi或达到最大的迭代次数,设 最后得到的二值图像为B二 [b(x,y)];步骤13:得到用于单个字符识别的融合图像G二 [g(x,y)],g(x,y)定义为3. 根据权利要求1所述融合二值图像与灰度图像的字符识别的方法,其特征在于,图像的归一化包括步骤21 :计算融合图像G二 [g(x, y)]的质心(x。, y。),把质心调整为归一化图像F二 [f(x,,y,)]的中心(W2/2,H2/2):<formula>formula see original document page 3</formula>其中g,(x)和gy(y)分别为融合图像6= [g(x,...
【专利技术属性】
技术研发人员:张树武,杨武夷,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。