The invention discloses a method and a device for identifying characters, used to improve the accuracy of character recognition, and ensure the stability of character recognition, including the method provided by the embodiment of the invention of the first character image according to at least two scales to zoom, second character image of at least two scales for second characters; images of each scale are extracted into at least two different types of features, the first character of at least two different types of second character images corresponding to the various scales of the fusion process; and reduce the dimensionality of the first character at least two different types of character image corresponding to the second different scales of. Second character second character images corresponding to different scales; the second character input classifier, identify and The character result corresponding to the first character image.
【技术实现步骤摘要】
一种字符识别方法和装置
本专利技术涉及计算机
,尤其涉及一种字符识别方法和装置。
技术介绍
光学字符识别(英文全称:OpticalCharacterRecognition,英文简称:OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印出来的字符图像,通过检测暗、亮的模式确定字符图像的特征,然后用字符识别方法将字符的特征翻译成计算机文字的过程,在OCR中,需要对文本资料进行扫描,得到图像文件,然后对图像文件进行分析处理,从而获取到文字及版面信息。在OCR的处理过程中,特征是识别字符的关键信息,每个不同的字符都需要通过对应的特征来和其他字符进行区分,字符的特征描述也是OCR的最重要的关键因素之一,目前常见的字符特征有如下三种:1、字符模板,即将样本字符图像存档,用测试字符图像直接与其进行比对。2、字符轮廓,即将字符的轮廓信息提取出来,以此作为比对的依据。3、纹理描述,通过采用一定的纹理描述方法,将字符图像转化为纹理特征,依次进行比对识别。本专利技术的专利技术人在实现本专利技术的过程中发现,上述现有技术存至少存在如下技术问题:1、识别准确率低,尤其对于中文等大字符集合,往往识别效率会降低。2、鲁棒性偏低,测试字符往往有各种复杂的背景、光照、大小等干扰因素,现有技术很难有稳定的高效的识别效果。
技术实现思路
本专利技术实施例提供了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性。为解决上述技术问题,本专利技术实施例提供以下技术方案:第一方面,本专利技术实施例提供一种字符的识别方法,包括:对第一字符图像按照至少两个尺度分别进行缩放处 ...
【技术保护点】
一种字符识别方法,其特征在于,包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。
【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。2.根据权利要求1所述的方法,其特征在于,所述对第一字符图像按照至少两个尺度分别进行缩放处理之前,所述方法还包括:对所述第一字符图像进行中心化处理,得到字符块居中的第一字符图像。3.根据权利要求2所述的方法,其特征在于,所述对所述第一字符图像进行中心化处理,包括:计算所述第一字符图像在水平方向和垂直方向上的灰度分布的重心位置以及所述第一字符图像的方差;根据所述第一字符图像在水平方向和垂直方向上的灰度分布的重心位置以及所述第一字符图像的方差调整所述第一字符图像,使所述第一字符图像中的字符块在调整后的第一字符图像上处于居中的位置。4.根据权利要求1所述的方法,其特征在于,所述对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,包括:对每一种尺度的第二字符图像都提取到预置的多种类型中的至少两种类型的特征,所述预置的多种类型包括:梯度投影特征、梯度方向直方图HOG特征、灰度模板特征、Gabor特征、局部二值模式LBP特征、小波变换特征。5.根据权利要求1所述的方法,其特征在于,所述对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,包括:对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征先进行融合处理,然后对融合后的结果再进行降维处理;或,对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征先进行降维处理,然后对降维后的结果再进行融合处理。6.根据权利要求1所述的方法,其特征在于,所述将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果,包括:计算所述第二字符特征与样本特征均值的余弦相似度;选择余弦相似度最高的样本特征对应的字符作为与所述第一字符图像对应的字符结果。7.一种字符...
【专利技术属性】
技术研发人员:王红法,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。