灰度字符图像归一化装置和灰度字符图像归一化方法制造方法及图纸

技术编号:8191142 阅读:412 留言:0更新日期:2013-01-10 02:01
本发明专利技术提供了一种灰度字符图像归一化装置和一种灰度字符图像归一化方法。所述灰度字符图像归一化包括:灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。

【技术实现步骤摘要】

本专利技术涉及字符识别技术,尤其涉及灰度字符识别技术。
技术介绍
传统的OCR (Optical Character Recognition-光学字符识别)技术专注于扫描文档中的文字识别。一般情况下,在前景和背景容易区分的情况下,传统的基于二值图像的字符识别可获得较高的识别精度。近年来,越来越多的字符识别需求来自于基于照相机的文档图像、web图像和自然场景图像。在这些图像中,文字往往不够清晰,背景也不够干净。进一步而言,低分辨率、模糊、畸变、光照变化和复杂背景等诸多会使图像质量降低的因素容易在这些图像中出现。所有这些因素使得自然场景图像中的文字识别非常困难,极具挑战性。很难准确地将文字从这些图像中分割出来,由此,传统的二值字符识别方法不能发挥 出原有的功效。另外,在字符识别引擎中,通常只接受固定大小的字符图像,多数字符图像不能直接满足这一要求。因此,在进行字符识别前,需要归一化到引擎所要求的图像尺寸。在常规的二值字符识别中,需要假定字符图像的背景是干净的、从而易于分割,但自然场景图像往往不能满足这个假设。若要在尺寸归一化中保持字符纵横比(即保形变换),则会在字符周围产生白条,这会对灰度字符识别产生很大的负面影响。
技术实现思路
本专利技术鉴于现有技术的上述情况提出,用以克服或缓解因现有技术的缺陷而造成的一种或更多种缺点,至少提供一种有益的选择。根据本专利技术的一个方面,提供了一种灰度字符图像归一化方法,所述方法包括灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。根据本专利技术的另一个方面,提供了一种灰度字符图像归一化装置,所述装置包括灰度分布参数获得单元,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化单元,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。根据本专利技术的再一方面,提供了一种逻辑部件可读程序以及存储该逻辑部件可读程序的逻辑部件可读有形存储介质,当所述逻辑部件可读程序被逻辑部件执行时,能够使所述逻辑部件用作本文所述的灰度字符图像归一化装置或使所述逻辑部件实现本文所述的灰度字符图像归一化方法。应该注意,术语“包括/包含/具有”在本文使用时指特征、要件、步骤或组件的存在,但并不排除一个或更多个其它特征、要件、步骤或组件的存在或附加。以上的一般说明和以下结合附图的详细说明都是示意性的,不是对本专利技术的保护范围的限制。附图说明从以下参照附图对本专利技术的详细描述中,将更清楚地理解本专利技术的以上和其它目的、特征和优点。在附图中,相同或类似的标号指示相同或类似的元素。图I示出了依据本专利技术一种实施方式的灰度字符图像灰度分布归一化方法的流程图。图2是以灰度直方图的方式示出了图I的步骤S103的技术效果的示意图。图3示出了将待识别的灰度字符图像统一变换为黑底白字的灰度字符图像的情况下,依据本专利技术实施方式的字符图像保形归一化的流程图。图4示出了将待识别的灰度字符图像统一变换为白底黑字的灰度字符图像的情况下,依据本专利技术实施方式的字符图像保形归一化的流程图。图5示出了本专利技术的保形归一化方法与常规灰度字符归一化方法的比较。图6示出了依据本专利技术一种实施方式的灰度字符图像灰度分布归一化装置的方框图。图7示出了依据本专利技术一种实施方式的灰度字符图像尺寸归一化装置。图8示出了可用于实施根据本专利技术实施例的方法和装置的计算机的示意性框图。具体实施例方式下面参照附图对本专利技术的实施方式进行详细的说明。依据本专利技术的实施方式,在进行自然场景字符识别时,一般需要进行如下的步骤(I)将彩色字符图像灰度化,得到灰度字符图像;(2)灰度字符图像归一化;(3)进行灰度字符识别。本领域已经知道了很多种将彩色图像灰度化的方法,例如常用的彩色图像灰度化方法使用以下公式将RGB值转化为灰度值Gray。Gray = (R+G+B) / 3Gray = 0. 301R+0. 586G+0. 113B其他的方法也是本领域技术人员所知的,本文不予详述。对灰度字符进行识另II,也可以采用本领域所知的各种方法,例如可以采用基于CNN (Convolutional NeuralNetwork,卷积神经网络)分类器的自然场景文字识别方法。灰度字符图像归一化可以包括灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化这两者或者这两者中的一个。当灰度字符图像归一化可以包括灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化这两者时,灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化可以按照任意的顺序进行。下面介绍依据本专利技术一种实施方式的进行字符图像归一化的方法。图I示出了依据本专利技术一种实施方式的灰度字符图像灰度分布归一化的方法的流程图。如图I所示,依据本专利技术的一种实施方式的灰度字符图像分布归一化方法,首先,在步骤S101,获得待识别灰度字符图像的灰度分布参数。所述的灰度分布参数例如为该待识别灰度字符图像的灰度级数目(灰度级的数目)以及该待识别灰度字符图像的灰度均值。然后,在步骤S102,利用预先保存的、根据训练字符图像样本(样本图像)所获得的灰度分布参数和所获得的该待识别灰度字符图像的灰度分布参数,对待识别灰度字符图像的各像素的灰度值进行变换,使得所述待识别灰度字符图像的灰度分布参数与训练样本灰度字符图像的灰度分布参数相接近,从而实现所述灰度字符图像灰度分布的归一化。该步骤也称灰度分布校准步骤。具体地,在一种实施例中,利用以下的公式对该待识别灰度字符图像的各像素的灰度进行变换。a (X) = s* (χ-c) +Cs为灰度范围尺度因子,c为待识别灰度字符图像的灰度均值,C为根据训练样本灰度字符图像所预先获得的灰度均值。X表示待识别灰度字符图像的像素的灰度值,a(x)为转换后的待识别灰度字符图像的像素的灰度值。在一种实施方式中,S = L/1,其中L为训练样本的灰度字符图像的灰度级的数目,I为所述待识别灰度字符图像的灰度级的数目。在另一种实施方式中,可以采用以下的公式计算s 权利要求1.一种灰度字符图像归一化方法,所述方法包括 灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数; 灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。2.根据权利要求I所述的方法,其中利用公式a(x)=s* (x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近, 其中X表示待识别灰度字符图像的像素的灰度值,a (X)为待识别灰度字符图像的像素的转换后的灰度值,s = L/l,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,I为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。3.根据权利要求I所述的方法,其中利用公式a(x)=s* (x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近, 其中X表示待识别灰度字符图像的像素的灰度值,a(x)为待测灰度字符像素的转换后的灰度值,4.根据本文档来自技高网...

【技术保护点】
一种灰度字符图像归一化方法,所述方法包括:灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱远平孙俊直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利