证件图像的文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：43832340 阅读：12 留言：0更新日期：2024-12-31 18:31

本说明书实施例公开了一种证件图像的文本识别方法、装置、存储介质及电子设备。该方法利用预训练的证件图像文本识别模型来进行证件图像的文本识别。该证件图像文本识别模型在训练过程中，通过预先训练的教师分支从证件图像文字条样本中提取文本掩码图像作为第一学生分支的伪标签，提取字符结构特征作为第二学生分支的伪标签，在教师分支和第一学生分支之间，通过第一损失函数来进行文字条级别的自监督训练，在教师分支和第二学生分支之间，通过第二损失函数来进行字符级别的自监督训练，从而使得证件图像文本识别模型具有较高的文本识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，尤其涉及一种证件图像的文本识别方法、装置、存储介质及电子设备。

技术介绍

1、在基于证件图像识别的身份认证领域中，通常需要通过文本识别模型来从证件图像中提取文本信息，以用于用户身份的甄别。传统的文本识别模型大多是采用有监督算法训练得到的，其训练过程需要大量有监督的训练样本。然后，大量证件图像的标注十分困难，这导致现有的文本识别模型的识别精度并不高。

技术实现思路

1、本说明书的一个或多个实施例提供了一种证件图像的文本识别方法、装置、存储介质及电子设备，能够利用无监督的证件图像样本训练文本识别模型，并能提高证件图像文本识别模型的识别精度。

2、第一方面，提供了一种证件图像文本识别模型的训练方法，该方法包括：

3、获取无监督的证件图像文字条样本；

4、利用教师分支从所述证件图像文字条样本中提取文本掩码图像和字符结构特征；

5、将所述证件图像文字条样本输入第一学生分支，得到预测文本序列特征；

6、根据所述文本掩码...

【技术保护点】

1.一种证件图像文本识别模型的训练方法，包括：

2.如权利要求1所述的方法，将所述证件图像文字条样本输入第一学生分支，得到预测文本序列特征，具体包括：

3.如权利要求1所述的方法，将所述证件图像文字条样本输入第二学生分支，得到预测字符结构特征，具体包括：

4.如权利要求1所述的方法，所述教师分支包括：

5.如权利要求1所述的方法，所述第一学生分支包括：

6.如权利要求1所述的方法，所述第二学生分支包括：

7.如权利要求1所述的方法，所述方法还包括：

8.一种证件图像的文本识别方法，包括：

9....

【技术特征摘要】

1.一种证件图像文本识别模型的训练方法，包括：

2.如权利要求1所述的方法，将所述证件图像文字条样本输入第一学生分支，得到预测文本序列特征，具体包括：

3.如权利要求1所述的方法，将所述证件图像文字条样本输入第二学生分支，得到预测字符结构特征，具体包括：

4.如权利要求1所述的方法，所述教师分支包括：

5.如权利要求1所述的方法，所述第一学生分支包括：

6.如权利要求1所述的方法，所述第二学生分支包括：

7.如权利要求...

【专利技术属性】
技术研发人员：陈志军，
申请(专利权)人：蚂蚁区块链科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人