字符识别方法和设备技术

技术编号:14567549 阅读:62 留言:0更新日期:2017-02-06 01:09
本发明专利技术公开了一种字符识别方法和设备。该字符识别方法包括:利用回归模型确定待识别图像的待识别字符区域;以及在待识别字符区域中进行字符识别。回归模型根据第一样本图像的字符区域获得。第一样本图像包括与待识别图像J相同类型的图像。根据本发明专利技术提供的字符识别方法和设备,由于利用根据样本图像获得的回归模型来确定待识别字符区域,因此对字符的定位具有精确度高、适应性强的特点,可以极大提高字符识别的精度和可靠性。

【技术实现步骤摘要】

本专利技术涉及模式识别领域,具体涉及一种字符识别方法和设备
技术介绍
在许多领域,均需要进行字符识别。下面以银行卡卡号识别为例进行说明。在金融、财务、保险和电商等行业的业务中,经常涉及到银行卡(包括借记卡、信用卡等)信息,而银行卡卡号是其中最关键的信息。大多数情况下,当使用银行卡卡号时,需要用户人工识别该银行卡卡号并将其输入相关设备,这一过程费时且容易出错。目前,出现了一些可以从银行卡图像中自动识别银行卡卡号的系统。这些系统可以通过智能手机、平板电脑等设备上的摄像头获取银行卡图像,并自动定位和识别银行卡卡号。参见图1a至1d,在其中示出了银行卡图像的示例。类似上述自动识别银行卡卡号的系统的字符识别系统在识别精度和适应性两方面存在不足之处。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种至少部分地解决上述问题的字符识别方法和设备。根据本专利技术一个方面,提供了一种字符识别方法。该字符识别方法包括以下步骤。利用回归模型确定待识别图像的待识别字符区域。在待识别字符区域中进行字符识别。回归模型根据第一样本图像的字符区域获得。第一样本图像包括与待识别图像相同类型的图像。根据本专利技术另一个方面,提供了一种字符识别设备。该字符识别设备包括区域确定装置和字符识别装置。区域确定装置用于利用回归模型确定待识别图像的待识别字符区域。字符识别装置用于在待识别字符区域中进行字符识别。回归模型根据第一样本图像的字符区域获得。第一样本图像包括与待识别图像相同类型的图像。根据本专利技术提供的字符识别方法和设备,由于利用根据样本图像获得的回归模型来确定待识别字符区域,因此对字符的定位具有精确度高、适应性强的特点,从而可以极大提高字符识别的精度和可靠性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1a至1d示出银行卡图像的示例;图2示出根据本专利技术一个实施例的字符识别方法的流程图;图3示出银行卡图像的另一示例;图4示出银行卡的字符区域的示例;图5示出根据本专利技术一个实施例的回归模型的训练方法的流程图;图6示出根据本专利技术一个实施例的确定待识别图像的待识别字符区域的步骤的流程图;图7示出根据本专利技术一个实施例的在待识别字符区域中进行字符识别的步骤的流程图;图8示出根据本专利技术一个实施例的提取子图像的示意图;图9示出银行卡图像的又一示例;图10示出根据本专利技术一个实施例的对待识别字符区域进行水平校正的示意图;以及图11示出根据本专利技术一个实施例的字符识别设备的示意性框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。根据本专利技术实施例的字符识别方法和设备可以应用于多种字符识别领域,例如可以对银行卡上的银行卡号、身份证上的身份证号、工作证上的工号、营业执照上的注册号等各种号码进行识别。作为示例,下文以银行卡卡号识别为例对本专利技术提供的字符识别方法和设备进行描述,这不应构成对本专利技术的限制。为了有效识别图像中的字符,本专利技术提供了一种字符识别方法。图2示出了根据本专利技术一个实施例的字符识别方法200的流程图。如图2所示,该字符识别方法200包括步骤S210和步骤S220。在步骤S210,利用回归模型确定待识别图像J的待识别字符区域。该回归模型根据第一样本图像的字符区域获得。字符区域是指目标字符存在的区域。目标字符是期望识别的字符,例如银行卡的卡号。待识别字符区域是指待识别图像J中的待识别字符区域。参见图3,示出了银行卡图像的另一示例。在图3所示的银行卡图像中,由方框301包围的区域为待识别字符区域,也就是银行卡图像中的卡号区域。第一样本图像包括与待识别图像J相同类型的图像。相同类型的图像是指两图像来源于包括位置相似度满足预定条件的字符区域的对象。下文以第一对象和第二对象来帮助阐述所述预定条件,第一对象和第二对象仅用于区分目的,其并不代表顺序。例如,假设第一对象的字符区域在第一对象中的位置用其字符区域的四个顶点坐标来表示,第二对象的字符区域在第二对象中的位置用其字符区域的四个顶点坐标来表示。所述预定条件可以是第一对象和第二对象的高度(用H表示)和宽度(用W表示)均相同,第一对象的四个顶点的横坐标和第二对象的四个顶点的横坐标均在1/12W-11/12W的范围内,第一对象的四个顶点的纵坐标和第二对象的四个顶点的纵坐标均在1/3H-2/3H的范围内,并且第一对象的字符区域的顶点的横坐标与第二对象的字符区域的对应顶点的横坐标之间的差值不超过1/6W,第一对象的字符区域的顶点的纵坐标与第二对象的字符区域的对应顶点的纵坐标之间的差值不超过1/3H。如图4所示,以银行卡400为例,假设银行卡的高度为H,宽度为W。银行卡卡号通常出现在银行卡上的区域401内。区域401在银行卡中占据1/3H*10/12W的面积,如果某个对象的字符区域超出这个范围则说明该对象不是银行卡。换言之,相同类型的图像采集于相同类型的拍摄对象,例如均为银行卡。这样,该两张银行卡的待识别字符区域是大小、位置大致相同的,位置相似度满足预定条件。虽然采集其图像时,银行卡可能会歪斜等,但是银行卡图像的待识别字符区域的位置是大致相同的。对于任意两张身份证来说,虽然局部会有不同,例如,持卡人姓名处,但是,绝大多数区域是完全相同的。因此,两个银行卡的图像属于相同类型的图像,而一个银行卡图像与一个身份证图像属于不同类型的图像。可以通过图像采集装置来获得待识别图像J,例如银行卡图像。图像采集装置可以是例如智能手机、平板电脑等移动终端上的摄像头,也可以是数码相机等单独的摄像装置。上述图像采集装置的示例仅用于说明目的,并不构成对本专利技术的限制。图像采集装置可以是其他任何合适的、能够采集待本文档来自技高网...

【技术保护点】
一种字符识别方法,包括:利用回归模型确定待识别图像J的待识别字符区域;以及在所述待识别字符区域中进行字符识别;其中,所述回归模型根据第一样本图像的字符区域获得,所述第一样本图像包括与所述待识别图像J相同类型的图像。

【技术特征摘要】
1.一种字符识别方法,包括:
利用回归模型确定待识别图像J的待识别字符区域;以及
在所述待识别字符区域中进行字符识别;
其中,所述回归模型根据第一样本图像的字符区域获得,所述第一样本
图像包括与所述待识别图像J相同类型的图像。
2.如权利要求1所述的字符识别方法,其中,所述回归模型经训练而获
得,所述回归模型的训练包括以下步骤:
将所述第一样本图像的字符区域的绝对顶点坐标归一化;
将所述第一样本图像缩放,以获得具有标准尺寸的第一样本图像;
根据预设的特征计算方法计算所述具有标准尺寸的第一样本图像的特
征;以及
利用回归算法,根据所述第一样本图像的字符区域的、归一化的顶点坐
标以及所述具有标准尺寸的第一样本图像的特征计算所述回归模型。
3.如权利要求2所述的字符识别方法,其中,所述确定待识别图像J的
待识别字符区域包括:
将所述待识别图像J缩放,以获得具有所述标准尺寸的待识别图像J’;
根据所述预设的特征计算方法计算所述具有所述标准尺寸的待识别图像
J’的特征f(J');
将所述特征f(J')输入所述回归模型,以获得所述待识别字符区域的、归
一化的顶点坐标P(J');以及
基于所述归一化的顶点坐标P(J')计算所述待识别字符区域的绝对顶点坐
标P(J)。
4.如权利要求2所述的字符识别方法,其中,所述预设的特征计算方法
包括梯度特征计算方法和/或纹理特征计算方法。
5.如权利要求1至4任一项所述的字符识别方法,其中,所述在所述待

\t识别字符区域中进行字符识别包括:
对所述待识别字符区域进行二值化操作;以及
基于所述二值化操作的结果,利用字符模板来进行字符识别。
6.如权利要求1至4任一项所述的字符识别方法,其中,所述在所述待
识别字符区域中进行字符识别是利用多类分类器进行,所述多类分类器经训
练而获得,所述多类分类器的训练包括以下步骤:
计算第二样本图像中的字符子图像的特征,所述第二样本图像包括与所
述待识别图像J相同类型的图像;以及
根据所述字符子图像的特征和对应的字符训练所述多类分类器。
7.如权利要求6所述的字符识别方法,其中,所述在所述待识别字符区
域中进行字符识别包括:
提取所述待识别字符区域中的相同宽度的子图像直至遍历整个待识别字
符区域;
计算所述子图像的特征;以及
利用多类分类器,基于所述子图像的特征进行字符识别;
其中两个相邻子图像之间具有重叠部分,并且其中所述子图像的宽度大
于或等于最大字符宽度并且小于或等于最小字符宽度与字符间隔之和。
8.如权利要求7所述的字符识别方法,其中,
在所述计算第二样本图像中的字符子图像的特征之前,所述多类分类器
的训练还包括:将所述字符子图像缩放为具有标准高度,并保持所述字符子
图像的宽高比不变;并且
在所述提取所述待识别字符区域中的相同宽度的子图像之前,所述在所
述待识别字符区域中进行字符识别还包括:将所述待识别字符区域缩放为具
有所述标准高度,并保持所述待识别字符区域的宽高比不变。
9.如权利要求1至4任一项所述的字符识别方法,其中,在在所述待识
别字符区域中进行字符识别之前,所述字符识别方法进一步...

【专利技术属性】
技术研发人员:姚聪周舒畅周昕宇吴育昕印奇
申请(专利权)人:北京旷视科技有限公司北京小孔科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1