卡证图像结构化处理方法及装置制造方法及图纸

技术编号:40059359 阅读:23 留言:0更新日期:2024-01-16 22:26
本说明书实施例公开了一种卡证图像结构化处理方法,包括:获取目标卡证图像的OCR识别结果;通过预先配置的文本提取模板从所述OCR识别结果中提取语义信息;所述文本提取模板用于描述预设的关键词与所述关键词对应的目标字段的候选区域之间的关联关系,并通过预设的正则表达式对所述候选区域中的字段内容进行匹配,得到第一匹配结果;基于所述第一匹配结果和所述关键词,确定所述语义信息。相应地,本发明专利技术公开了一种卡证图像结构化处理装置。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种卡证图像结构化处理方法及装置


技术介绍

1、ekyc(electronic know your customer),也就是线上实名认证,需要用户将本人证件拍照上传,配合人脸拍摄、信息验证等手段,来证明自己的身份。在这个过程中,系统内部会对用户上传的证件图片进行ocr识别,将图片模态转化为文本模态。但是ocr后只有一串串文本,如果要提取出其中的语义,就需要定制逻辑化规则或训练特定模型来实现ocr识别结果的结构化处理,但这两种结构化方案在针对新类型的卡证时,需要重新编辑逻辑规则或训练新模型,成本较高。


技术实现思路

1、本说明书的一个或多个实施例提供了一种卡证图像结构化处理方法及装置,能够采用结构化的卡证识别模板完成不同类型卡证的识别任务,简化卡证图像识别流程。

2、根据第一方面,提供了一种卡证图像结构化处理方法,包括:

3、获取目标卡证图像的ocr识别结果;

4、通过预先配置的文本提取模板从所述ocr识别结果中提取语义信息;

5本文档来自技高网...

【技术保护点】

1.一种卡证图像结构化处理方法,包括:

2.如权利要求1所述的方法,所述语义信息为key-value键值对,其中,

3.如权利要求1所述的方法,所述文本提取模板还用于将所述候选区域中的字段内容输入预训练的文本分类模型,得到所述候选区域中的字段内容对应的分类结果;将所述分类结果和所述关键词进行匹配,确定第二匹配结果;基于所述第二匹配结果从所述第一匹配结果中筛选出所述目标字段,基于所述关键词和所述目标字段,确定所述语义信息。

4.如权利要求1所述的方法,所述文本提取模板采用以下方式预先配置得到,包括:

5.如权利要求4所述的方法,所述文本提取模...

【技术特征摘要】

1.一种卡证图像结构化处理方法,包括:

2.如权利要求1所述的方法,所述语义信息为key-value键值对,其中,

3.如权利要求1所述的方法,所述文本提取模板还用于将所述候选区域中的字段内容输入预训练的文本分类模型,得到所述候选区域中的字段内容对应的分类结果;将所述分类结果和所述关键词进行匹配,确定第二匹配结果;基于所述第二匹配结果从所述第一匹配结果中筛选出所述目标字段,基于所述关键词和所述目标字段,确定所述语义信息。

4.如权利要求1所述的方法,所述文本提取模板采用以下方式预先配置得到,包括:<...

【专利技术属性】
技术研发人员:刘昱彤
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1