证件栏位识别的方法和装置制造方法及图纸

技术编号:24854955 阅读:42 留言:0更新日期:2020-07-10 19:08
本发明专利技术公开了证件栏位识别的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对证件图片中的所有像素点进行聚类,得到二值化图像;采用连通域算法确定所述二值化图像中的各个连通域以及每个所述连通域的位置信息;根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位。该实施方式能够避免由于图片曝光较高而导致的栏位识别不准确或无法识别的情况发生,提高证件栏位识别的准确性。

【技术实现步骤摘要】
证件栏位识别的方法和装置
本专利技术涉及计算机
,尤其涉及一种证件栏位识别的方法和装置。
技术介绍
在身份证OCR(OpticalCharacterRecognition,光学字符识别)中,需要定位的位置较多。以身份证为例,需要定位姓名、性别、民族、出生日期、发证机关等栏位;以房产证为例,需要定位权利人、共有情况、坐落、不动产单元号、权利类型、权利性质等栏位。通过定位各个栏位的位置,识别栏位中的内容。现有技术中进行OCR识别时,通常先在证件图片中找到一个栏位的位置作为定位标志位置,然后通过事先测量的位置关系推算栏位内容以及其他栏位的所在位置。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:当证件图片的曝光较高时,图片中像素点的像素值较低,往往不能准确辨别其中可以用于定位标志位置的栏位,进而导致栏位识别不准确或无法识别。
技术实现思路
有鉴于此,本专利技术实施例提供一种证件栏位识别的方法和装置,能够避免由于图片曝光较高而导致的栏位识别不准确或无法识别的情况发生,提高证件栏位识别的准确性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种证件栏位识别的方法,包括:对证件图片中的所有像素点进行聚类,得到二值化图像;采用连通域算法确定所述二值化图像中的各个连通域以及每个所述连通域的位置信息;根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位。可选地,对证件图片中的所有像素点进行聚类,包括:将所述证件图片中的所有像素点聚为两类,以所述两类中像素值较大的一类作为前景类,将所述前景类中的所有像素点作为前景像素点。可选地,对证件图片中的所有像素点进行聚类之后,还包括:将所述证件图片中背景类的像素点设置为白色。可选地,采用K-means算法对证件图片中的所有像素点进行聚类。可选地,所述连通域算法为:Two-Pass方法或Seed-Filling方法。可选地,所述证件配置信息中包括:所述证件图片中各个栏位的栏位位置信息;根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位,包括:对于任一连通域,将与所述任一连通域的位置信息匹配的栏位位置信息所对应的栏位,作为所述任一连通域的栏位。可选地,所述证件为具有预设格式的文件。根据本专利技术实施例的第二方面,提供一种证件栏位识别的装置,包括:聚类模块,对证件图片中的所有像素点进行聚类,得到二值化图像;连通模块,采用连通域算法确定所述二值化图像中的各个连通域以及每个所述连通域的位置信息;识别模块,根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位。可选地,所述聚类模块对证件图片中的所有像素点进行聚类,包括:将所述证件图片中的所有像素点聚为两类,以所述两类中像素值较大的一类作为前景类,将所述前景类中的所有像素点作为前景像素点。可选地,所述聚类模块还用于:对证件图片中的所有像素点进行聚类之后,将所述证件图片中背景类的像素点设置为白色。可选地,所述聚类模块采用K-means算法对证件图片中的所有像素点进行聚类。可选地,所述连通域算法为:Two-Pass方法或Seed-Filling方法。可选地,所述证件配置信息中包括:所述证件图片中各个栏位的栏位位置信息;所述识别模块根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位,包括:对于任一连通域,将与所述任一连通域的位置信息匹配的栏位位置信息所对应的栏位,作为所述任一连通域的栏位。可选地,所述证件为具有预设格式的文件。根据本专利技术实施例的第三方面,提供一种证件栏位识别的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例第一方面提供的方法。根据本专利技术实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例第一方面提供的方法。上述专利技术中的一个实施例具有如下优点或有益效果:本专利技术对证件图片中的所有像素点进行聚类、根据聚类得到的二值化图片进行栏位识别,能够避免由于图片曝光较高而导致的栏位识别不准确或无法识别的情况发生,提高证件栏位识别的准确性。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是本专利技术实施例的证件栏位识别的方法的主要流程的示意图;图2是本专利技术实施例的证件栏位识别的装置的主要模块的示意图;图3是本专利技术实施例可以应用于其中的示例性系统架构图;图4是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。根据本专利技术实施例的一个方面,提供了一种证件栏位识别的方法。图1是本专利技术实施例的证件栏位识别的方法的主要流程的示意图,如图1所示,证件栏位识别的方法,包括:步骤S101、步骤S102和步骤S103。步骤S101、对证件图片中的所有像素点进行聚类,得到二值化图像。本专利技术实施例的证件是指具有预设格式的文件,根据证件类型即可确定证件中各个栏位的位置。证件类型例如为身份证、户口本、银行卡、护照、车牌等。证件图片是指证件的复印件或扫描件等。栏位是指证件中的信息项。以身份证为例,其中包括姓名、性别等栏位;以户口本首页为例,其中包括户主姓名、籍贯等栏位。将物理或抽象对象的集合分成由类似的对象组成的多个类的过程称为聚类。本专利技术实施例中通过聚类实现证件图片中前景与背景的分割。每个像素点可以采用三维坐标来标识,包括:横坐标、纵坐标和像素值。可选地,对证件图片中的所有像素点进行聚类,包括:将所述证件图片中的所有像素点聚为两类,以所述两类中像素值较大的一类作为前景类,将所述前景类中的所有像素点作为前景像素点。通常,证件图片中各个栏位的像素点的像素值大于背景区域中像素点的像素值。本实施例中,通过将像素值较大的一类作为前景类,进而进行后续识别的步骤,能够避免由于证件图片曝光过度而导致的无法识别或识别准确性低的情况发生。可选地,对证件图片中的所有像素点进行聚类之后,还包括:将所述证件图片中背景类的像素点设置为白色。如此,能够最大化地降低背景类像素点对后续确定连通域的影响,进一步提高识别结果的准确性。聚类方法可以根据实本文档来自技高网...

【技术保护点】
1.一种证件栏位识别的方法,其特征在于,包括:/n对证件图片中的所有像素点进行聚类,得到二值化图像;/n采用连通域算法确定所述二值化图像中的各个连通域以及每个所述连通域的位置信息;/n根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位。/n

【技术特征摘要】
1.一种证件栏位识别的方法,其特征在于,包括:
对证件图片中的所有像素点进行聚类,得到二值化图像;
采用连通域算法确定所述二值化图像中的各个连通域以及每个所述连通域的位置信息;
根据预设的证件配置信息以及每个所述连通域的位置信息,确定每个所述连通域对应的栏位。


2.如权利要求1所述的方法,其特征在于,对证件图片中的所有像素点进行聚类,包括:
将所述证件图片中的所有像素点聚为两类,以所述两类中像素值较大的一类作为前景类,将所述前景类中的所有像素点作为前景像素点。


3.如权利要求2所述的方法,其特征在于,对证件图片中的所有像素点进行聚类之后,还包括:将所述证件图片中背景类的像素点设置为白色。


4.如权利要求1所述的方法,其特征在于,采用K-means算法对证件图片中的所有像素点进行聚类。


5.如权利要求1所述的方法,其特征在于,所述连通域算法为:Two-Pass方法或Seed-Filling方法。


6.如权利要求1所述的方法,其特征在于,所述证件配置信息中包括:所述证件图片中各个栏位的栏位位置信...

【专利技术属性】
技术研发人员:李虎熊博颖易显维
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1