【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种证件图像的文本识别方法、装置、存储介质及电子设备。
技术介绍
1、在基于证件图像识别的身份认证领域中,通常需要通过文本识别模型来从证件图像中提取文本信息,以用于用户身份的甄别。传统的文本识别模型大多是采用有监督算法训练得到的,其训练过程需要大量有监督的训练样本。然后,大量证件图像的标注十分困难,这导致现有的文本识别模型的识别精度并不高。
技术实现思路
1、本说明书的一个或多个实施例提供了一种证件图像的文本识别方法、装置、存储介质及电子设备,能够利用无监督的证件图像样本训练文本识别模型,并能提高证件图像文本识别模型的识别精度。
2、第一方面,提供了一种证件图像文本识别模型的训练方法,该方法包括:
3、获取无监督的证件图像文字条样本;
4、利用教师分支从所述证件图像文字条样本中提取文本掩码图像和字符结构特征;
5、将所述证件图像文字条样本输入第一学生分支,得到预测文本序列特征;
6、根据所述文本掩码
...【技术保护点】
1.一种证件图像文本识别模型的训练方法,包括:
2.如权利要求1所述的方法,将所述证件图像文字条样本输入第一学生分支,得到预测文本序列特征,具体包括:
3.如权利要求1所述的方法,将所述证件图像文字条样本输入第二学生分支,得到预测字符结构特征,具体包括:
4.如权利要求1所述的方法,所述教师分支包括:
5.如权利要求1所述的方法,所述第一学生分支包括:
6.如权利要求1所述的方法,所述第二学生分支包括:
7.如权利要求1所述的方法,所述方法还包括:
8.一种证件图像的文本识别方法,包括
9....
【技术特征摘要】
1.一种证件图像文本识别模型的训练方法,包括:
2.如权利要求1所述的方法,将所述证件图像文字条样本输入第一学生分支,得到预测文本序列特征,具体包括:
3.如权利要求1所述的方法,将所述证件图像文字条样本输入第二学生分支,得到预测字符结构特征,具体包括:
4.如权利要求1所述的方法,所述教师分支包括:
5.如权利要求1所述的方法,所述第一学生分支包括:
6.如权利要求1所述的方法,所述第二学生分支包括:
7.如权利要求...
【专利技术属性】
技术研发人员:陈志军,
申请(专利权)人:蚂蚁区块链科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。