证件号码定位和识别方法技术

技术编号:4347984 阅读:553 留言:0更新日期:2012-04-11 18:40
本发明专利技术证件号码定位和识别方法,属于OCR技术领域,从包含证件号码的图像中定位和识别证件号码,本方法首先利用图像的水平投影值,将所述图像分割成一个或多个个行区域;然后利用所述行区域的图像的宽高比、证件号码宽高宽高比特征,去除不可能是证件号码所在的行;接着将可能包含证件号码的所述每个行区域分割成一个或多干个列区域,利用证件号码位数及间距较小的特征,从而定位出所述证件号码在图像上的位置;最后利用识别引擎对所述证件号码的区域图像的进行识别。本发明专利技术可简单、方便、快速的完成身份证、军官证、护照、驾驶执照等证件号码信息的获取,从而大大降低了人力成本,提高了工作效率。

【技术实现步骤摘要】

本专利技术属于0CR(0ptical Character Recognition,光学字符识别)
,涉 及一种证件号码定位和识别的方法。
技术介绍
随着人们参与的各项社会活动日益增多,对身份证、护照、驾驶执照等的号码信息 核对要求地越来越严格和频繁,例如在海关、银行业务、安全检查、交通稽查、网上订票后领 取门票、活动抽奖、股票投资等,在这些情况下都需要对当事人证件号码信息进行确认。在 一般情况下,证件号码的信息核对都是人工进行的,这种繁琐却很重要的工作既导致很大 的人力成本的浪费、又容易产生不准确的问题;有些证件号码采用了智能IC卡技术,可以 通过证件中嵌入的芯片读取证件信息,但这种方法要求在证件中嵌入芯片,对于没有或不 能嵌入芯片的证件则不能进行信息获取,例如身份证、军官证等。 如专利号为200410017928. 7的中国专利技术专利采用第二公民身份证解读识别电路 对身份证进行识别,这种识别过程依赖于识别电路和配套的设备。这种识别电路必须硬件 成本高昂,而且由于必须与发证机关的数据端相连接,适用性较差。 将OCR技术应用于证件识别一般要求与其相配套的扫描仪装置并对证件图像获 取有特定规范和要求,例如要求证件必须放在扫描仪的特定位置进行扫描,扫描出的所有 同类证件图像的大小都是相同的并且是完整的证件图像,并预先计算证件号码在证件中的 相对位置,利用预先设定的位置定位证件号码区域,此方法要求有扫描仪,并且对证件图像 有比较严格的限制,不够灵活并且操作繁琐,目前如何快速、自动、方便、准确地进行证件号 码识别技术还属于空白。
技术实现思路
本专利技术,对接收待识别的证件图像进行行分割,根据行 分割结果去除非证件号码所在的行区域,然后对行区域进行列分割,并利用证件号码位数 确定证件号码所在行区域,进而确定证件号码在图像上的左右边界位置;接着识别证件号 码区域图像;再对证件号码识别结果进行校验并输出识别结果。本方法采用了 0CR技术从 包含证件号码的图像中定位和识别证件号码,能够快速、有效地获得证件号码识别结果,并 考虑到了证件识别的特殊性,在不增加硬件成本的前提下,准确、快速、方便地对证件信息 进行有效地采集,具有良好的市场前景和实用价值。 ,包括如下步骤 步骤1 :利用输入的证件图像在水平方向上的灰度累加值进行图像的行区域分 割,得到一个或多个行区域; 步骤2 :对得到的行区域进行列区域分割,利用证件号码位数确定证件号码所在 行区域; 步骤3 :在证件号码所在列区域上,利用证件号码位数及证件号码的间距特征确定证件号码在图像上的左右边界,得到各证件号码的所在区域图像; 步骤4 :利用识别引擎对所述证件号码的所在区域图像进行字符识别。所述步骤1中的行区域分割进一步包括根据设定的边界阈值以及图像水平投影直方图判定行区域的开始与结束;当扫描到某一行上的投影值大于所述边界阈值时,则判定为一个行区域的开始,继续进行行扫描,当扫描到某行的投影值小于或等于所述边界阈值时则判定为这一行区域结束。 所述步骤2执行前,将得到的各行区域的宽高比与证件号码的宽高比相比较,去 除不在证件号码宽高比设定值范围内的行区域。所述步骤3中的列区域分割进一步包括对可能包含证件号码的每个行区域进行垂直投影,根据垂直直方图将每个所述行区域的图像分别分割成一个或多个列图像区域。所述步骤2中的列区域分割采用连通域方法获得行区域中的列区域。 所述步骤2中利用证件号码位数确定证件号码所在行区域时,如果列分割后得到的列图像的个数不少于证件号码位数,该行区域确定为证件号码所在的行区域,从而获得证件号码在图像上的上下边界,反之继续对其他行区域进行列分割,直至全部行区域判断完毕。 所述步骤3中确定证件号码在图像上的左右边界位置时,如果当证件号码所在行 区域中连续出现间距较小的、与证件号码位数相同的列区域,则这些列区域的最左、最右边 界为证件号码所在图像区域的左、右边界,反之转到步骤2,直至全部行区域判断完毕。 所述步骤4中进行字符识别时,针对证件号码识别结果进行年月日和校验位校 验。 本专利技术,与现有技术相比,具有以下优点 1、本专利技术采用0CR技术从包含证件号码的图像中定位和识别证件号码,脱离了硬件芯片的限制,能够对证件的标识信息进行有效的识别,可根据获得的身份证、军官证、护照、驾驶执照等证件图像对其中的信息进行识别。 2、本专利技术考虑了证件识别的特殊性,将证件号码位数信息与列分割结果进行比 较,并根据结果定义证件号码的有效边界,对有效信息快速定位,从而保证了识别结果的准 确性,有效简单方便的完成证件号码信息的获取。 3、本专利技术在识别过程结束后,通过获取的号码信息可以进一步完成身份验证,对 识别结果进行校验,从而大大降低了人力成本,提高了工作效率。 4、本专利技术采用的行区域分割技术适应性良好,待识别的号码完整地包含在图像中 即可,号码所在的行不一定严格地平行于矩形照片的边,证件号码在图像中的具体位置也 没有限定和要求。附图说明 图1是本专利技术的对身份证进行定位识别的流程图; 图2是本专利技术实例的示意图; 图2 (a)是用手机拍摄的一张灰度身份证图像; 图2 (b)是利用本方面方法获得的身份证号码的定位结果; 图2 (C)是水平投影直方4 图2 (d)是根据水平投影值进行行分割得到的若干行区域图像结果; 图2 (e)是身份证号码所在行的列分割得到的若干列区域图像结果; 图2(f)是身份证号码的定位结果。具体实施例方式以下结合附图并以中国居民身份证为例,对本专利技术的及 系统进行详细说明。但本专利技术不限于身份证,还可以用于其他证件,如驾驶执照、军官证、护昭等。 本方法中,采集图像时,可以利用任何种类的带摄像头的设备,例如手机、扫描仪、数码相机等,拍摄身份证图像或者进行实时视频拍摄。在一个优选实施例中,被采集的身份证图像应该是完整清晰的,而且优选无任何背景图像。其中,图2(a)是用手机拍摄的一张灰度身份证图像。当然,在其他实施例中,被采集的身份证图像应该至少包含完全的身份证号码,背景图像应不应过于复杂,以便系统快速高效运行。 本专利技术,如图1所示,包含如下步骤 步骤一 将得到的图像被输入至本系统中,输入的方法可以是有线的、也可以是近程或远程无线传输的。然后对输送的图像进行二值化处理,即将图像转换成只具有黑白两种颜色信息的图像,这样图像的操作比较简单并且速度快。 本实施例中,如图2(a)所示,黑色代表前景,这时前景是黑色像素,也就是图像上 有信息含量的内容,包括文字但不仅仅是文字,例如图中的人的头像等都属于前景,类似图 像中较黑的部分。而在其他实施例中,也可以采用白色代表前景。 利用水平投影直方图将黑白图像分割成一个或多个行区域。在行分割前首先对本 专利技术的图像的上下左右关系做出定义,上下是相对于号码行而言,如图2(a)所示,上下是 指身份证号码所在行的上或下,而左右是指身份证号码所在行的左或右。 将带有身份证号码的二值图像从上到下依次进行行扫描获得图像的水平投影直 方图。图像的水平投影直方图,即图像每行中前景像素的总数目,然后在该水平投影直方图 上,利用一个阈值作为边界,所谓阈值就是一个判别值,高于这个值是在边界之内,而低于 这个值就是在边界之外,将该黑白本文档来自技高网...

【技术保护点】
一种证件号码定位和识别方法,其特征在于,包括如下步骤:步骤一:利用输入的证件图像在水平方向上的灰度累加值进行图像的行区域分割,得到一个或多个行区域;步骤二:对得到的行区域进行列区域分割,利用证件号码位数确定证件号码所在行区域;步骤三:在证件号码所在列区域上,利用证件号码位数及证件号码的间距特征确定证件号码在图像上的左右边界,得到各证件号码的所在区域图像;步骤四:利用识别引擎对所述证件号码的所在区域图像进行字符识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:肖潇刘正珍
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1