【技术实现步骤摘要】
证件信息获取方法、装置、设备以及存储介质
本公开涉及人工智能
,具体涉及计算机视觉和深度学习
,尤其涉及证件信息获取方法、装置、设备以及存储介质,可应用于智慧城市和智慧金融场景下。
技术介绍
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。比如客户在办理金融业务时,为了确保业务操作的安全性,需要对客户的身份信息进行校验,一般都是客户在客户业务办理系统上传自己的证件照片,以便业务人员利用OCR(OpticalCharacterRecognition,光学字符识别)技术对该证件照片进行校验。然而,现有的证件识别方法存在检测精度不高、准确性低的问题。
技术实现思路
本公开提供了一种证件信息获取方法、装置、设备以及存储介质。根据第一方面,提供了一种证件信息获取方法,包括:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;根据字符优化结果,更新文本识别结果;输出更新后的文本识别结果。根据第二方面,提供了一种证件信息获取装置,包括:图像获取单元,被配置成获取目标证件图像;文本识别单元,被配置成对目标证件图像进行文本识别,确定文本识别结果;字符优化单元,被配置成响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;结果更新单元,被配置成根据字符 ...
【技术保护点】
1.一种证件信息获取方法,包括:/n获取目标证件图像;/n对所述目标证件图像进行文本识别,确定文本识别结果;/n响应于确定所述文本识别结果中包括字符,对所述文本识别结果中的字符进行再次识别,得到字符优化结果;/n根据所述字符优化结果,更新所述文本识别结果;/n输出更新后的文本识别结果。/n
【技术特征摘要】
1.一种证件信息获取方法,包括:
获取目标证件图像;
对所述目标证件图像进行文本识别,确定文本识别结果;
响应于确定所述文本识别结果中包括字符,对所述文本识别结果中的字符进行再次识别,得到字符优化结果;
根据所述字符优化结果,更新所述文本识别结果;
输出更新后的文本识别结果。
2.根据权利要求1所述的方法,其中,所述对所述目标证件图像进行文本识别,确定文本识别结果,包括:
利用预先训练的文本识别模型对所述目标证件图像进行文本识别,确定文本识别结果。
3.根据权利要求2所述的方法,其中,所述文本识别模型通过以下训练步骤得到:
获取证件模板图像以及语料信息库;
根据所述证件模板图像以及所述语料信息库,生成多个模拟样本证件图像;
将各模拟样本证件图像作为输入,将输入的模拟样本证件图像对应的语料信息作为期望输出,训练得到所述文本识别模型。
4.根据权利要求3所述的方法,其中,所述证件模板图像包括多个字段;以及
所述根据所述证件模板图像以及所述语料信息库,生成多个模拟样本证件图像,包括:
确定所述证件模板图像中的各字段对应的语料的生成规则;
从所述语料信息库中确定出与所述证件模板图像中的各字段匹配的语料信息;
根据所述生成规则对所确定的语料信息进行调整,得到调整后语料信息;
根据所述证件模板图像的以及所述调整后语料信息,生成多个模拟样本证件图像。
5.根据权利要求1-4任一项所述的方法,其中,所述根据所述字符优化结果,更新所述文本识别结果,包括:
确定所述字符优化结果中第一预设位置的第一字符串;
确定所述文本识别结果中第二预设位置的第二字符串;
根据所述第一字符串和所述第二字符串,确定目标字符串;
根据所述目标字符串,更新所述文本识别结果。
6.根据权利要求1-5任一项所述的方法,其中,所述对所述目标证件图像进行文本识别,确定文本识别结果,包括:
确定所述目标证件图像中各字段所在的行区域;
对各行区域进行文本识别,确定文本识别结果。
7.根据权利要求1-6任一项所述的方法,其中,所述对所述目标证件图像进行文本识别,确定文本识别结果,包括:
确定所述目标证件图像中的印章区域;
对所述印章区域进行文本识别,确定印章区域的文本识别结果。
8.根据权利要求7所述的方法,其中,所述方法还包括:
根据所述印章区域的文本识别结果,确定所述目标证件图像的类别;
利用与所述类别对应的文本识别模型,对所述目标证件图像的文本识别结果进行核验。
9.根据权利要求1-8任一项所述的方法,其中,所述获取证件图像,包括:
获取待分析图像;
响应于确定所述待分析图像中包括证件图像,确定所述证件图像的边框;
根据所述边框,确定目标证件图像。
10.根据权利要求9所述的方法,其中,所述根据所述边框,确定目标证件图像,包括:
对所述边框进行矫正,将矫正后的图像作为目标证件图像。
11.一种证件信息获取装置,包括:
图像获取单元,被配置成获取目标证件图像;
文本识别单元,被配置成对所述目标证件图像进行文本识别,确定文本识别结果;
字符优化单元,被配置成响应于确定所述文本识别结果中包括字符,对所述文本识别结果中的字符进行再次识别,得到字符优...
【专利技术属性】
技术研发人员:白瑞斌,魏翔,孙逸鹏,姚锟,刘经拓,韩钧宇,丁二锐,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。