一种字符识别方法和装置制造方法及图纸

技术编号:15437939 阅读:65 留言:0更新日期:2017-05-26 03:56
本发明专利技术公开了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性,本发明专利技术实施例提供的方法包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。

Character recognition method and device

The invention discloses a method and a device for identifying characters, used to improve the accuracy of character recognition, and ensure the stability of character recognition, including the method provided by the embodiment of the invention of the first character image according to at least two scales to zoom, second character image of at least two scales for second characters; images of each scale are extracted into at least two different types of features, the first character of at least two different types of second character images corresponding to the various scales of the fusion process; and reduce the dimensionality of the first character at least two different types of character image corresponding to the second different scales of. Second character second character images corresponding to different scales; the second character input classifier, identify and The character result corresponding to the first character image.

【技术实现步骤摘要】
一种字符识别方法和装置
本专利技术涉及计算机
,尤其涉及一种字符识别方法和装置。
技术介绍
光学字符识别(英文全称:OpticalCharacterRecognition,英文简称:OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印出来的字符图像,通过检测暗、亮的模式确定字符图像的特征,然后用字符识别方法将字符的特征翻译成计算机文字的过程,在OCR中,需要对文本资料进行扫描,得到图像文件,然后对图像文件进行分析处理,从而获取到文字及版面信息。在OCR的处理过程中,特征是识别字符的关键信息,每个不同的字符都需要通过对应的特征来和其他字符进行区分,字符的特征描述也是OCR的最重要的关键因素之一,目前常见的字符特征有如下三种:1、字符模板,即将样本字符图像存档,用测试字符图像直接与其进行比对。2、字符轮廓,即将字符的轮廓信息提取出来,以此作为比对的依据。3、纹理描述,通过采用一定的纹理描述方法,将字符图像转化为纹理特征,依次进行比对识别。本专利技术的专利技术人在实现本专利技术的过程中发现,上述现有技术存至少存在如下技术问题:1、识别准确率低,尤其对于中文等大字符集合,往往识别效率会降低。2、鲁棒性偏低,测试字符往往有各种复杂的背景、光照、大小等干扰因素,现有技术很难有稳定的高效的识别效果。
技术实现思路
本专利技术实施例提供了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性。为解决上述技术问题,本专利技术实施例提供以下技术方案:第一方面,本专利技术实施例提供一种字符的识别方法,包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。第二方面,本专利技术实施例还提供一种字符的识别装置,包括:图像缩放模块,用于对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;多类型特征提取模块,用于对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;字符特征处理模块,用于对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;字符识别模块,用于将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。从以上技术方案可以看出,本专利技术实施例具有以下优点:在本专利技术实施例中,首先对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像,然后对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征,接下来对各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到第二字符特征,最后将第二字符特征输入分类器,识别出与第一字符图像对应的字符结果。本专利技术实施例中,第一字符图像作为需要进行字符识别的图像,被缩放为多种尺度的第二字符图像,每一种尺度的第二字符图像都提取到了多种不同类型的特征,得到至少两种不同类型的第一字符特征,由于进行特征提取的不再是唯一的一种尺度的字符图像,而是多种尺度的字符图像,因此可以解决被测试的字符图像在尺度不一致时存在鲁棒性偏低的问题,保证字符识别的稳定性。另外多种不同类型的第一字符特征经过融合处理和降维处理后得到第二字符特征,该第二字符特征是第一字符特征经过融合处理和降维处理,因此在第二字符特征经过特征融合和降维后的字符特征更为准确,将该第二字符特征输入分类器时可以提高识别速度以及分类器的准确率,从而可以提高字符识别的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种字符识别方法的流程方框示意图;图2为本专利技术实施例提供的字符识别方法的一种应用场景示意图;图3-a为本专利技术实施例提供的一种字符识别装置的组成结构示意图;图3-b为本专利技术实施例提供的一种字符识别装置的组成结构示意图;图3-c为本专利技术实施例提供的一种图像中心化处理模块的组成结构示意图;图3-d为本专利技术实施例提供的一种字符识别模块的组成结构示意图;图4为本专利技术实施例提供的字符识别方法应用于服务器的组成结构示意图。具体实施方式本专利技术实施例提供了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。以下分别进行详细说明。本专利技术字符识别方法的一个实施例,具体可以应用于对字符进行识别处理的OCR技术中,本专利技术提供的字符识别方法是一种多尺度、多特征融合的字符特征描述方法,可以较好的解决了现有的字符特征描述算法的不足,在实际测试中,本专利技术提供的字符识别方法在识别准确率以及鲁棒性都有极大的提升。接下来对本专利技术提供的方法进行详细说明,请参阅图1所示,本专利技术一个实施例提供的字符识别方法,可以包括如下步骤:101、对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像。在本专利技术实施例中,首先获取到第一字符图像,该第一字符图像可以是扫描后得到文字资料,该文字资料扫描后为第一字符图像,该第一字符图像作为需要进行字符识别的图像进行多尺度的缩放处理,可以得到多个尺度的第二字符图像,在这种话实现方式中,第一字符图像为原始字符图像。例如一个第一字符图像可以被缩放为三种尺度的第二字符图像,三种尺度的第二字符图像可以分别为16×16,32×32,48×48,64×64等。在本专利技术的一些实施例中,步骤101对第一字符图像按照至少两个尺度分别进行缩放处理之前,本专利技术实施例提供的字符识别方法,还可以包括如下步骤:A1、对第一字符图像进行中心化处理,得到字符块居中的第一字符图像。在如上步骤A1中,图像缩放之前,先对第一字符图像进行中心化处理,其中中心化处理指的是调整第一字符图像的中心,调整第一字符图像的字符框的尺度,使第一字符图像中的字符块处于第一字符图像的居中位置。对第一字符图像的中心化处理可以使进行多尺度缩放处理的第一字符图像中字符块始终处于本文档来自技高网...
一种字符识别方法和装置

【技术保护点】
一种字符识别方法,其特征在于,包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。2.根据权利要求1所述的方法,其特征在于,所述对第一字符图像按照至少两个尺度分别进行缩放处理之前,所述方法还包括:对所述第一字符图像进行中心化处理,得到字符块居中的第一字符图像。3.根据权利要求2所述的方法,其特征在于,所述对所述第一字符图像进行中心化处理,包括:计算所述第一字符图像在水平方向和垂直方向上的灰度分布的重心位置以及所述第一字符图像的方差;根据所述第一字符图像在水平方向和垂直方向上的灰度分布的重心位置以及所述第一字符图像的方差调整所述第一字符图像,使所述第一字符图像中的字符块在调整后的第一字符图像上处于居中的位置。4.根据权利要求1所述的方法,其特征在于,所述对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,包括:对每一种尺度的第二字符图像都提取到预置的多种类型中的至少两种类型的特征,所述预置的多种类型包括:梯度投影特征、梯度方向直方图HOG特征、灰度模板特征、Gabor特征、局部二值模式LBP特征、小波变换特征。5.根据权利要求1所述的方法,其特征在于,所述对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,包括:对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征先进行融合处理,然后对融合后的结果再进行降维处理;或,对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征先进行降维处理,然后对降维后的结果再进行融合处理。6.根据权利要求1所述的方法,其特征在于,所述将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果,包括:计算所述第二字符特征与样本特征均值的余弦相似度;选择余弦相似度最高的样本特征对应的字符作为与所述第一字符图像对应的字符结果。7.一种字符...

【专利技术属性】
技术研发人员:王红法
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1