融合二值图像与灰度图像的字符识别的方法技术

技术编号：4347518 阅读：838 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种融合二值图像与灰度图像的字符识别的方法，包括对字符图像的二值图像与灰度图像的融合图像进行处理，进行字符识别：将字符图像的二值图像与灰度图像进行融合得到融合图像；对融合图像进行大小和位置的归一化；提取归一化图像的梯度直方图的特征；利用主分量分析与线性判别分析得到特征降维的变换矩阵；建立字符特征模板库，进行字符识别。本发明专利技术克服了基于字符的二值图像或者是基于字符的灰度图像的传统字符识别技术不能同时识别退化字符图像以及包含复杂背景的字符图像的缺点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于字符识别领域(简称OCR)，涉及一致融合二值图像与灰度图像的字符识别的方法。
技术介绍
传统的字符识别技术是基于字符的二值图像或者是基于字符的灰度图像。当基于字符的二值图像的识别技术应用于各种低质量图像，比如视频中的退化字符图像、身份证图像、汽车牌照、自然场景中的字符图像等低分辨率图像，由于二值化后的字符图像质量低，识别效果差。当基于字符的灰度图像的识别技术应用于包含复杂背景的字符图像，比如视频中的字符图像，由于字符图像包含非一致的背景，识别效果将变差。
技术实现思路
为了解决现有技术的问题，本专利技术的目的在于提供一种融合字符的二值图像与灰度图像进行字符识别的方法。为达成所述目的，本专利技术提供的，对所述二值图像与灰度图像的融合图像进行处理，进行字符识别，其包括以下步骤步骤l :设预处理后得到的单个字符图像的二值图像为<formula>formula see original document page 6</formula>其中位于第x行第y列的像素点的值为b。(x， y) ， b。(x， y)为0或1，图像的大小为W具;字符的灰度图像为<formula>formula see original document page 6</formula>位于第x行第y列的像素点的值为g。 (x， y) ，<formula>formula see original document page 6</formula>将字符图像的二值图像B。与灰度图像G。进行融合...

【技术保护点】
一种融合二值图像与灰度图像的字符识别的方法，其特征在于，对所述二值图像与灰度图像的融合图像进行处理，进行字符识别，其包括以下步骤：步骤１：设预处理后得到的单个字符图像的二值图像为Ｂ↓［０］＝［ｂ↓［０］（ｘ，ｙ）］，其中位于第ｘ行第ｙ列的像素点的值为ｂ↓［０］（ｘ，ｙ），ｂ↓［０］（ｘ，ｙ）为０或１，图像的大小为Ｗ↓［１］×Ｈ↓［１］；字符的灰度图像为Ｇ↓［ｃ］＝［ｇ↓［ｃ］（ｘ，ｙ）］，位于第ｘ行第ｙ列的像素点的值为ｇ↓［ｃ］（ｘ，ｙ），０≤ｇ↓［ｃ］（ｘ，ｙ）≤２５５；将字符图像的二值图像Ｂ↓［０］与灰度图像Ｇ↓［ｃ］进行融合，得融合后的图像Ｇ＝［ｇ（ｘ，ｙ）］，位于第ｘ行第ｙ列的像素点的值为ｇ（ｘ，ｙ），０≤ｇ（ｘ，ｙ）≤２５５；步骤２：在提取融合图像Ｇ＝［ｇ（ｘ，ｙ）］的特征前，先进行融合图像Ｇ＝［ｇ（ｘ，ｙ）］的位置和大小的归一化处理；图像归一化处理的输入图像为Ｇ＝［ｇ（ｘ，ｙ）］，归一化后的输出图像为Ｆ＝［ｆ（ｘ’，ｙ’）］，其大小分别为Ｗ↓［１］×Ｈ↓［１］和Ｗ↓［２×］Ｈ↓［２］；输入图像Ｇ＝［ｇ（ｘ，ｙ）］位于第ｘ行第ｙ列的像素点将被映射到Ｆ＝［ｆ（ｘ’，ｙ’）］位于...

【技术特征摘要】
一种融合二值图像与灰度图像的字符识别的方法，其特征在于，对所述二值图像与灰度图像的融合图像进行处理，进行字符识别，其包括以下步骤步骤1设预处理后得到的单个字符图像的二值图像为B0＝[b0(x，y)]，其中位于第x行第y列的像素点的值为b0(x，y)，b0(x，y)为0或1，图像的大小为W1×H1；字符的灰度图像为Gc＝[gc(x，y)]，位于第x行第y列的像素点的值为gc(x，y)，0≤gc(x，y)≤255；将字符图像的二值图像B0与灰度图像Gc进行融合，得融合后的图像G＝[g(x，y)]，位于第x行第y列的像素点的值为g(x，y)，0≤g(x，y)≤255；步骤2在提取融合图像G＝[g(x，y)]的特征前，先进行融合图像G＝[g(x，y)]的位置和大小的归一化处理；图像归一化处理的输入图像为G＝[g(x，y)]，归一化后的输出图像为F＝[f(x’，y’)]，其大小分别为W1×H1和W2×H2；输入图像G＝[g(x，y)]位于第x行第y列的像素点将被映射到F＝[f(x’，y’)]位于第x’行第y’列的像素点，通过输入图像和输出图像的坐标映射来实现图像归一化 <mfenced open='{' close=''><mtable> <mtr><mtd> <msup><mi>x</mi><mo>′</mo> </msup> <mo>=</mo> <msup><mi>x</mi><mo>′</mo> </msup> <mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo> </mrow></mtd> </mtr> <mtr><mtd> <msup><mi>y</mi><mo>′</mo> </msup> <mo>=</mo> <msup><mi>y</mi><mo>′</mo> </msup> <mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo> </mrow></mtd> </mtr></mtable> </mfenced>一维坐标映射为 <mrow><mfenced open='{' close=''> <mtable><mtr> <mtd><msup> <mi>x</mi> <mo>′</mo></msup><mo>=</mo><msup> <mi>x</mi> <mo>′</mo></msup><mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo></mrow> </mtd></mtr><mtr> <mtd><msup> <mi>y</mi> <mo>′</mo></msup><mo>=</mo><msup> <mi>y</mi> <mo>′</mo></msup><mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo></mrow> </mtd></mtr> </mtable></mfenced><mo>;</mo> </mrow>步骤3基于梯度直方图提取归一化图像的梯度直方图的特征；步骤4利用主分量分析与线性判别分析对归一化图像的梯度直方图的特征进行降维处理，得到特征降维的变换矩阵；步骤5建立字符特征模板库，读取特征降维的变换矩阵并对字符进行识别。2. 根据权利要求1所述融合二值图像与灰度图像的字符识别的方法，其特征在于，所述二值图像与灰度图像的融合包括步骤11 :对灰度图像G。 = [g。(x，y)]的像素点值g。(x，y)利用传统的最大类间方差法求得阈值th。stu，求一个全局阈值th，令th = aX th。stu， a是一个常数；利用全值阈值th对灰度图像G。二 [g。(x，y)]的像素点值g。(x，y)进行门限处理，得到二值图像Bg = [bg(x，y)]，二值图像的像素点值bg(x， y)定义为步骤12 :利用二值形态学对二值图像B。进行条件膨胀，设D是一个3X3的图像，其每个位置的像素值为1 ;对二值图像B。进行条件膨胀为A+, 二C8(十D)r^g，l,2，-，A^ 二^根据上式对二值图像Bi反复进行条件膨胀，直到Bi+1 = Bi或达到最大的迭代次数，设最后得到的二值图像为B二 [b(x，y)];步骤13:得到用于单个字符识别的融合图像G二 [g(x，y)]，g(x，y)定义为3. 根据权利要求1所述融合二值图像与灰度图像的字符识别的方法，其特征在于，图像的归一化包括步骤21 :计算融合图像G二 [g(x， y)]的质心(x。， y。)，把质心调整为归一化图像F二 [f(x，，y，)]的中心(W2/2，H2/2):<formula>formula see original document page 3</formula>其中g,(x)和gy(y)分别为融合图像6= [g(x，...

【专利技术属性】
技术研发人员：张树武，杨武夷，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人