证件图像识别方法、装置、终端及存储介质制造方法及图纸

技术编号：26792205 阅读：24 留言：0更新日期：2020-12-22 17:07

本发明专利技术公开了一种证件图像识别方法、装置、终端及存储介质，属于图像处理技术领域。方法包括：将OCR证件图像输入到第一图像识别模型中，输出目标人像区域，第一图像识别模型根据面积重合度训练得到；将OCR证件图像输入到第二图像识别模型中，输出目标证件号区域和目标有效期区域，第二图像识别模型根据长宽比及文本信息之间的相似度训练得到。本发明专利技术获取OCR证件图像，将该图像输入到第一图像识别模型和第二图像识别模型中，输出目标人像区域、目标证件号区域及目标有效期区域。由于模型并不是采用人工评测方式确定的，而是基于面积重合度、长宽比及文本信息确定的，因而所确定的模型更准确，基于该模型进行图像识别时，识别结果更准确。

全部详细技术资料下载

【技术实现步骤摘要】
证件图像识别方法、装置、终端及存储介质
本专利技术涉及图像处理领域，特别涉及一种证件图像识别方法、装置、终端及存储介质。
技术介绍
在金融领域，当用户在虚拟银行开户时，虚拟银行系统需要对用户的身份进行验证，同时用户也需要对虚拟银行所开设账号的输入信息进行验证。在进行验证时，会对用户所用的证件(包括大陆身份证、香港身份证、港澳通行证等)进行OCR(OpticalCharacterRecognition，光学字符识别)文字识别，得到OCR证件图像，并从OCR证件图像中识别出人像区域、证件号区域、有效期区域，进而基于所识别出的人像区域，与采集到的用户人像区域进行比对，实现对用户的身份的验证，并通过将所识别出的证件号区域和有效期区域展示给用户，实现对账户的输入信息的验证。上述验证过程中，证件图像识别的准确性，直接影响到用户的账户安全及用户体验效果，因此，如何对OCR证件图像进行识别，成为本领域人员较为关注的问题。目前，相关技术在对OCR证件图像进行识别之前，采用人工方式对初始图像识别模型的识别结果进行评测，基于评测结果，对初始图像识别模型的模型参数进行优化，得到图像识别模型，进而基于所确定的图像识别模型，对OCR证件图像进行识别，得到人像区域、证件号区域和有效期区域。然而，由于人工评测时用户的主观性较强，将影响到图像识别模型的评测结果及模型参数的优化过程，进一步影响所确定的图像识别模型的准确性，因此，基于该图像识别模型进行证件图像识别时，识别结果准确较差。
技术实现思路
为了解决相关技术的...

【技术保护点】
1.一种证件图像识别方法，其特征在于，所述方法包括：/n获取待识别的光学字符识别OCR证件图像，所述待识别的OCR证件图像通过对证件进行拍摄及OCR文字识别得到；/n将所述待识别的OCR证件图像输入到第一图像识别模型中，输出目标人像区域，所述第一图像识别模型根据标注结果与输出结果之间的面积重合度训练得到，所述第一图像识别模型用于基于OCR证件图像，识别出人像区域，所述目标人像区域用于与采集到的用户人像区域进行比对，以实现身份的验证；/n将所述待识别的OCR证件图像输入到第二图像识别模型中，输出目标证件号区域和目标有效期区域，所述第二图像识别模型根据输出结果的长宽比及标注结果与输出结果的文本信息之间的相似度训练得到，所述第二图像识别模型用于基于OCR证件图像，识别出证件号区域和有效期区域，所述目标证件号区域和所述目标有效期区域用于对输入信息进行验证。/n

【技术特征摘要】
1.一种证件图像识别方法，其特征在于，所述方法包括：
获取待识别的光学字符识别OCR证件图像，所述待识别的OCR证件图像通过对证件进行拍摄及OCR文字识别得到；
将所述待识别的OCR证件图像输入到第一图像识别模型中，输出目标人像区域，所述第一图像识别模型根据标注结果与输出结果之间的面积重合度训练得到，所述第一图像识别模型用于基于OCR证件图像，识别出人像区域，所述目标人像区域用于与采集到的用户人像区域进行比对，以实现身份的验证；
将所述待识别的OCR证件图像输入到第二图像识别模型中，输出目标证件号区域和目标有效期区域，所述第二图像识别模型根据输出结果的长宽比及标注结果与输出结果的文本信息之间的相似度训练得到，所述第二图像识别模型用于基于OCR证件图像，识别出证件号区域和有效期区域，所述目标证件号区域和所述目标有效期区域用于对输入信息进行验证。

2.根据权利要求1所述的方法，其特征在于，所述将所述待识别的OCR图像输入到第一图像识别模型中，输出目标人像区域之前，还包括：
获取多个训练样本图像，所述多个训练样本图像由不同类型的终端对处于不同拍摄环境及不同拍摄背景的多种类型的证件拍摄及OCR文字识别得到，每个训练样本图像具有人像标注区域；
获取初始第一图像识别模型；
将所述多个训练样本图像输入到所述第一初始图像识别模型中，输出每个训练样本图像对应的人像比对区域；
基于每个训练样本图像对应的人像标注区域和人像比对区域，对所述第一初始图像识别模型进行评测；
基于评测结果，对所述第一初始图像识别模型的模型参数进行优化，得到所述第一图像识别模型。

3.根据权利要求2所述的方法，其特征在于，所述基于每个训练样本图像对应的人像标注区域和人像比对区域，对所述第一初始图像识别模型进行评测，包括：
获取每个训练样本图像对应的人像标注区域的顶点坐标；
获取每个训练样本图像对应的人像比对区域的顶点坐标；
基于每个训练样本图像对应的人像标注区域和人像比对区域的顶点坐标，确定每个训练样本图像对应的人像标注区域和人像比对区域是否匹配；
当匹配的训练样本图像数量小于第一预设数量，确定对所述第一初始图像识别模型的评测结果为未通过。

4.根据权利要求3所述的方法，其特征在于，所述基于每个训练样本图像对应的人像标注区域和人像比对区域的顶点坐标，确定每个训练样本图像对应的人像标注区域和人像比对区域是否匹配，包括：
对于任一训练样本图像，根据所述训练样本图像对应的人像标注区域和人像比对区域的顶点坐标，获取所述训练样本图像对应的人像标注区域和人像比对区域之间的面积重合度；
当所述训练样本图像对应的人像标注区域和人像比对区域之间的面积重合度超过指定阈值，确定所述训练样本图像对应的人像标注区域和人像比对区域匹配。

5.根据权利要求1所述的方法，其特征在于，所述将所述待识别的OCR证件图像输入到第二图像识别模型中，输出目标证件号区域和目标有效期区域之前，还包括：
获取多个训练样本图像，所述多个训练样本图像由不同类型的终端对处于不同拍摄环境及不同拍摄背景的多种类型的证件拍摄及OCR文字识别得到，每个训练样本图像具有证件号标注区域和有效期标注区域；
获取初始第二图像识别模型；
将所述多个训练样本图像输入到所述第二初始图像识别模型中，输出每个训练样本图像对应的证件号比对区域和有效期比对区域；
基于每个训练样本图像对应的证件号标注区域、有效期标注区域、证件号比对区域及有效期比对区域，对所述第二初始图像识别模型进行评测；
基于评测结果，对所述第二初始图像识别模型的模型参数进行优化，得到所述第二图像识别模型。

6.根据权利要求5...

【专利技术属性】
技术研发人员：唐嘉龙，彭梅英，鲁四喜，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人