字符识别方法及装置制造方法及图纸

技术编号:14337266 阅读:102 留言:0更新日期:2017-01-04 10:32
本公开是关于一种字符识别方法及装置。该方法包括:获取包含待识别字符的图像;基于样本权重确定所述图像中的字符区域;对于字符区域进行字符切割;识别切割得到的单个字符。该技术方案在确定字符区域时考虑每个样本的权重值,能够摒弃一些噪声区域或者不完整字符区域的边缘点,更为精确的得到字符区域的上下边界线,进而得到准确的字符区域,最终能够有效提高字符识别的准确率。

【技术实现步骤摘要】

本公开涉及图像处理
,尤其涉及一种字符识别方法及装置
技术介绍
目前,在车牌识别、充值卡识别、信用卡识别等字符识别中,为了提高字符识别的准确率和识别速度,经常需要先确定字符所在区域的上下边界线,然后再确定字符所在区域,进而进行字符的识别。有关技术中一般采用线性回归拟合的方法来确定字符所在区域的上下边界线,但该方法准确率低,经常出现误判的情况。
技术实现思路
本公开实施例提供一种字符识别方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种字符识别方法,该方法包括:获取包含待识别字符的图像;基于样本权重确定所述图像中的字符区域;对于字符区域进行字符切割;识别切割得到的单个字符。可选地,获取包含待识别字符的图像之后,所述方法还包括:提取所述图像中的感兴趣区域。可选地,基于样本权重确定所述图像中的字符区域之前,所述方法还包括:对所述图像进行预处理。可选地,对所述图像进行预处理的步骤包括:对所述图像进行二值化;对二值化后的图像进行去噪。可选地,所述去噪包括阈值去噪、滤波去噪、小波变换去噪、连通域去噪、形态学去噪中的一种或几种。可选地,对所述图像进行预处理的步骤还包括:对去噪后的图像提取连通域;根据预设规则剔除不含有字符的连通域。可选地,基于样本权重确定所述图像中的字符区域的步骤包括:根据预设规则在所述图像中确定单个字符区域;提取单个字符区域的顶部端点和底部端点;剔除样本权重值小于一预定阈值的端点;基于剩余的端点得到上下边界线,组成字符区域。可选地,所述预设规则包括:字符的宽度和高度符合一预设比例,字符的宽度符合一预设大小,单个字符区域的像素和大小在一预设范围内中的一个或多个。可选地,所述样本权重值为某一端点所在区域为一个完整的字符区域的概率值。可选地,利用拟合的方法基于剩余的端点得到上下边界线。根据本公开实施例的第二方面,提供一种字符识别装置,该装置包括:图像获取模块,用于获取包含待识别字符的图像;字符区域确定模块,用于基于样本权重确定所述图像中的字符区域;字符切割模块,用于对于字符区域进行字符切割;字符识别模块,用于识别切割得到的单个字符。可选地,所述装置还包括:感兴趣区域提取模块,用于提取所述图像中的感兴趣区域。可选地,所述装置还包括:预处理模块,用于对所述图像进行预处理。可选地,所述预处理模块包括:二值化子模块,用于对所述图像进行二值化;去噪子模块,用于对二值化后的图像进行去噪。可选地,所述去噪子模块使用阈值去噪、滤波去噪、小波变换去噪、连通域去噪、形态学去噪中的一种或几种对于图像进行去噪。可选地,所述预处理模块还包括:连通域提取子模块,用于对去噪后的图像提取连通域;连通域筛选子模块,用于根据预设规则筛除不含有字符的连通域。可选地,所述字符区域确定模块包括:单个字符区域确定子模块,用于根据预设规则在所述图像中确定单个字符区域;端点提取子模块,用于提取单个字符区域的顶部端点和底部端点;端点筛选子模块,用于剔除样本权重值小于一预定阈值的端点;边界线确定子模块,用于基于剩余的端点得到上下边界线,组成字符区域。可选地,所述预设规则包括:字符的宽度和高度符合一预设比例,字符的宽度符合一预设大小,单个字符区域的像素和大小在一预设范围内中的一个或多个。可选地,所述样本权重值为某一端点所在区域为一个完整的字符区域的概率值。可选地,所述边界线确定子模块利用拟合的方法基于剩余的端点得到上下边界线。根据本公开实施例的第三方面,提供一种字符识别装置,该装置包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取包含待识别字符的图像;基于样本权重确定所述图像中的字符区域;对于字符区域进行字符切割;识别切割得到的单个字符。本公开的实施例提供的技术方案可以包括以下有益效果:上述技术方案,基于样本的权重进行字符区域的确定,即在通过提取出的单个字符区域端点确定字符区域的上下边界线时,获取某一端点所在区域为字符区域而非噪声区域的概率,并将该概率值作为该端点的样本权重参与到字符区域上下边界线的确定中去。由此,在确定字符区域时考虑每个样本的权重值,能够摒弃一些噪声区域或者不完整字符区域的边缘点,更为精确的得到字符区域的上下边界线,进而得到准确的字符区域,最终能够有效提高字符识别的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的字符识别方法的流程图。图2是根据另一示例性实施例示出的字符识别方法的流程图。图3是根据一示例性实施例提取得到的感兴趣区域图像。图4是根据另一示例性实施例示出的字符识别方法的流程图。图5是根据一示例性实施例示出的对图像进行预处理的流程图。图6是根据一示例性实施例对于二值化图像进行去噪后得到的图像。图7是根据另一示例性实施例示出的对图像进行预处理的流程图。图8是根据一示例性实施例示出的基于样本权重确定所述图像中的字符区域的流程图。图9是根据一示例性实施例提取得到的顶部端点和底部端点。图10是根据一示例性实施例拟合得到的字符区域上下边界线。图11是有关技术中线性回归拟合原理图。图12是根据一示例性实施例示出的字符识别装置的框图。图13是根据另一示例性实施例示出的字符识别装置的框图。图14是根据另一示例性实施例示出的字符识别装置的框图。图15是根据一示例性实施例示出的预处理模块的框图。图16是根据另一示例性实施例示出的预处理模块的框图。图17是根据一示例性实施例示出的字符区域确定模块的框图。图18是根据一示例性实施例示出的适用于字符识别装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例提供的技术方案,基于样本的权重进行字符区域的确定,即在通过提取出的单个字符区域端点确定字符区域的上下边界线时,获取某一端点所在区域为字符区域而非噪声区域的概率,并将该概率值作为该端点的样本权重参与到字符区域上下边界线的确定中去。由此,在确定字符区域时考虑每个样本的权重值,能够摒弃一些噪声区域或者不完整字符区域的边缘点,更为精确的得到字符区域的上下边界线,进而得到准确的字符区域,最终能够有效提高字符识别的准确率。图1是根据一示例性实施例示出的一种字符识别方法的流程图,如图1所示,所述字符识别方法包括以下步骤S101-S104:在步骤S101中,获取包含待识别字符的图像;在步骤S102中,基于样本权重确定所述图像中的字符区域;在步骤S103中,对于字符区域进行字符切割;在步骤S104中,识别切割得到的单个字符。在该实施例中,基于样本的权重进行字符区域的确定,这样能够摒弃一些噪声字符区域或者不完整字符区域的边缘点,更为精确的得到字符区域的上下边界线,进而得到准确的字符区域,最终能够有效提高字符识别的准确率在一个实施例中,所述待识别字符包括:本文档来自技高网...
字符识别方法及装置

【技术保护点】
一种字符识别方法,其特征在于,包括:获取包含待识别字符的图像;基于样本权重确定所述图像中的字符区域;对于字符区域进行字符切割;识别切割得到的单个字符。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取包含待识别字符的图像;基于样本权重确定所述图像中的字符区域;对于字符区域进行字符切割;识别切割得到的单个字符。2.根据权利要求1所述的方法,其特征在于,获取包含待识别字符的图像之后,所述方法还包括:提取所述图像中的感兴趣区域。3.根据权利要求1所述的方法,其特征在于,基于样本权重确定所述图像中的字符区域之前,所述方法还包括:对所述图像进行预处理。4.根据权利要求3所述的方法,其特征在于,对所述图像进行预处理的步骤包括:对所述图像进行二值化;对二值化后的图像进行去噪。5.根据权利要求4所述的方法,其特征在于,所述去噪包括阈值去噪、滤波去噪、小波变换去噪、连通域去噪、形态学去噪中的一种或几种。6.根据权利要求4所述的方法,其特征在于,对所述图像进行预处理的步骤还包括:对去噪后的图像提取连通域;根据预设规则剔除不含有字符的连通域。7.根据权利要求1所述的方法,其特征在于,基于样本权重确定所述图像中的字符区域的步骤包括:根据预设规则在所述图像中确定单个字符区域;提取单个字符区域的顶部端点和底部端点;剔除样本权重值小于一预定阈值的端点;基于剩余的端点得到上下边界线,组成字符区域。8.根据权利要求6或7所述的方法,其特征在于,所述预设规则包括:字符的宽度和高度符合一预设比例,字符的宽度符合一预设大小,单个字符区域的像素和大小在一预设范围内中的一个或多个。9.根据权利要求7所述的方法,其特征在于,所述样本权重值为某一端点所在区域为一个完整的字符区域的概率值。10.根据权利要求7所述的方法,其特征在于,利用拟合的方法基于剩余的端点得到上下边界线。11.一种字符识别装置,其特征在于,包括:图像获取模块,用于获取包含待识别字符的图像;字符区域确定模块,用于基于样本权重确定所述图像中的字符区域;字符切割模块,用于对于字符区域进行字符切割;字符识别模块,用于识别切割得到的单个字符。1...

【专利技术属性】
技术研发人员:陈志军秦秋平张旭华
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1