文字区域的定位方法、装置、设备及存储介质制造方法及图纸

技术编号:24208517 阅读:35 留言:0更新日期:2020-05-20 15:45
本申请涉及一种文字区域的定位方法、装置、设备及存储介质,方法包括:根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域;根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域;根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域;根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域。本申请用以能够快速定位证件图像中的文字区域,有效提高证件的验证效率。

Positioning method, device, equipment and storage medium of text area

【技术实现步骤摘要】
文字区域的定位方法、装置、设备及存储介质
本申请涉及图像处理
,尤其涉及一种中文字区域的定位方法、装置、设备及存储介质。
技术介绍
随着互联网普及以及技术的发展,证券、银行、保险等行业中的很多业务的办理也逐渐可以在终端设备(如VTM,手机等)上实现,目前最普遍的是网上银行、手机银行等。这些业务按照规定都是需要“客户本人持本人有效证件”进行办理。如果按传统方式在营业网点的柜面办理,需要客户本人持本人有效证件到柜面进行办理,由柜面工作人员现场验证客户身份。如果将这些业务搬到终端设备上,则面临的主要问题即是客户身份的验证,即如何确定是“客户本人持本人有效证件”在办理。上述过程需要进行两个阶段的验证:身份证信息验证,以及是否本人的验证。对于身份证验证,目前比较常用的做法是让客户分别拍身份证正反面的图像和人脸图像,然后传到后台审核人员进行人工审核(针对所有身份证)。泰国身份证中存在密集、不规则的文字,这些文字中所包含的是身份证的重要信息,例如包括泰国公民身份证明卡的泰文和英文说明,证号、持卡人的名和姓,出生日期、发卡日期、发卡部门以及官员签字等。如果能快速定位到泰国身份证中的密集文字区域,则能够有效提高泰国身份证的验证效率。
技术实现思路
本申请提供了一种文字区域的定位方法、装置、设备及存储介质,用以能够快速定位证件图像中的文字区域,有效提高证件的验证效率。第一方面,本申请实施例提供了一种文字区域定位方法,包括:根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域;根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域;根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域;根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域。可选地,根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,包括:将所述证件图像中的芯片作为所述参考元素,识别所述证件图像中芯片的像素位置;根据实际证件中芯片与文字区域的相对位置关系,以及所述证件图像中芯片的像素位置,确定所述证件图像中的文字区域,作为第一文字区域。可选地,识别所述证件图像中芯片的像素位置,包括:对所述证件图像进行预处理以及二值化后,根据实际证件中芯片的轮廓形状和面积大小,从二值化后的证件图像中识别出芯片的像素位置。可选地,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域,包括:对所述证件图像进行形态学处理,获取处理后的证件图像中亮度低于预设值的图像区域,得到第一处理图像;对所述第一处理图像进行梯度处理后得到第二处理图像;识别出所述第二处理图像中的各个文字字符区域,对所述各个文字字符区域之间的间隙进行填充后,得到第三处理图像;对所述第三处理图像进行二值化处理,得到所述证件图像中的文字区域,作为第二文字区域。可选地,根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域,包括:计算所述第一文字区域与所述第二文字区域的交集区域,作为第一交集区域,以及计算所述第一文字区域与所述第二文字区域的并集区域,作为第一并集区域;计算所述第一交集区域与所述第一并集区域的比值,若所得的比值大于或等于第一预设值,则将所述第一并集区域作为所述第一候选区域。可选地,根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域,包括:根据实际证件中文字区域的位置,定位所述证件图像中的外扩中心点,在所述证件图像中,以所述外扩中心点为中心外扩得到设定面积的区域,裁剪所述设定面积的区域,作为第二候选区域。可选地,根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域,包括:计算所述第一候选区域与所述第二候选区域的交集区域,作为第二交集区域,以及计算所述第一候选区域与所述第二候选区域的并集区域,作为第二并集区域;计算所述第二交集区域与所述第二并集区域的比值,若所得的比值大于或等于第二预设值,判断所述第二候选区域的边界是否在所述第一候选区域的边界所限定的范围内,若是,则将所述第二候选区域作为所述证件图像中最终的文字区域,否则,从所述第一候选区域中选取与所述第二候选区域大小相同的区域,作为所述证件图像中最终的文字区域。第二方面,本申请实施例提供了一种文字区域定位装置,包括:第一处理模块,用于根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域;第二处理模块,用于根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域;第三处理模块,用于根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域;第四处理模块,用于根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域。第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的文字区域定位方法。第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的文字区域定位方法。本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过证件图像中参考元素与文字区域的相对位置关系,确定证件图像中的第一文字区域,并且,直接通过图像特征识别得到证件图像中的第二文字区域,结合第一文字区域和第二文字区域得到第一候选区域,根据文字区域在实际证件中的位置,从证件图像中裁剪得到第二候选区域,综合该第一候选区域和第二候选区域,定位最终的文字区域,使得能够从多个角度定位文字区域,提高了文字区域定位的准确性,并且,不需要复杂的算法,能够快速的定位证件图像中的文字区域,有效提高了证件的验证效率。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例中文字区域定位的方法流程示意图;图2为本申请实施例本文档来自技高网...

【技术保护点】
1.一种文字区域定位方法,其特征在于,包括:/n根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域;/n根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域;/n根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域;/n根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域。/n

【技术特征摘要】
1.一种文字区域定位方法,其特征在于,包括:
根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域;
根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域;
根据实际证件中文字区域的位置,从所述证件图像中裁剪得到所述证件图像中的文字区域,作为第二候选区域;
根据所述第一候选区域和所述第二候选区域,定位所述证件图像中的文字区域。


2.根据权利要求1所述的文字区域定位方法,其特征在于,根据证件图像中参考元素的位置,以及所述参考元素与文字区域的相对位置关系,确定所述证件图像中的文字区域,作为第一文字区域,包括:
将所述证件图像中的芯片作为所述参考元素,识别所述证件图像中芯片的像素位置;
根据实际证件中芯片与文字区域的相对位置关系,以及所述证件图像中芯片的像素位置,确定所述证件图像中的文字区域,作为第一文字区域。


3.根据权利要求2所述的文字区域定位方法,其特征在于,识别所述证件图像中芯片的像素位置,包括:
对所述证件图像进行预处理以及二值化后,根据实际证件中芯片的轮廓形状和面积大小,从二值化后的证件图像中识别出芯片的像素位置。


4.根据权利要求1至3任一项所述的文字区域定位方法,其特征在于,根据文字的图像特征识别所述证件图像中的文字区域,作为第二文字区域,包括:
对所述证件图像进行形态学处理,获取处理后的证件图像中亮度低于预设值的图像区域,得到第一处理图像;
对所述第一处理图像进行梯度处理后得到第二处理图像;
识别出所述第二处理图像中的各个文字字符区域,对所述各个文字字符区域之间的间隙进行填充后,得到第三处理图像;
对所述第三处理图像进行二值化处理,得到所述证件图像中的文字区域,作为第二文字区域。


5.根据权利要求4所述的文字区域定位方法,其特征在于,根据所述第一文字区域和所述第二文字区域,确定所述证件图像的第一候选区域,包括:
计算所述第一文字区域与所述第二文字区域的交集区域,作为第一交集区域,以及计算所述第一文字区域与所述第二文字区域的并集区域,作为第一并集区域;
计算所述第一交集区域与所述第一并集区域的比值,若所得的比值大于或等于第一...

【专利技术属性】
技术研发人员:张陆彭展张燕锋
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1