文字识别模型的训练方法、文字识别方法、装置及设备制造方法及图纸

技术编号：42114832 阅读：21 留言：0更新日期：2024-07-25 00:35

本申请提供一种文字识别模型的训练方法、文字识别方法、装置及设备。该方法包括：将待训练数据分别输入至第一文字识别模型以及第二文字识别模型，相应得到第一文字识别模型所输出的第一预测值以及第二文字识别模型所输出的第二预测值；将第一预测值作为第一标签值，并将第二预测值作为第二标签值，以基于第一标签值对第二文字识别模型进行训练，并基于第二标签值对第一文字识别模型进行训练；基于训练后的第一文字识别模型和训练后的第二文字识别模型的预测结果，在训练后的第一文字识别模型和训练后的第二文字识别模型确定目标文字识别模型。本申请的方法可高效进行模型训练。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种文字识别模型的训练方法、文字识别方法、装置及设备。

技术介绍

1、文字识别技术可用于处理存在大量文字信息的文档、表单等，一般可通过构建神经网络模型进行文字识别，然而，传统的神经网络模型通常依赖于大量标注数据进行监督学习，从而使得训练后的模型能准确进行文字识别；且对于特定领域或特定类型的文字识别模型而言，需要对该特定领域或特征类型的文档进行大量的手动标注，以通过该标注的文档进行模型训练。

2、但是，标注数据获取方式较难，可能无法满足神经网络模型所需的标注数据体量，导致训练得到的神经网络模型在处理非结构化文档时性能有限，准确率和泛化能力较差；而对训练数据进行手动标注的方式成本高且效率低。

技术实现思路

1、本申请提供一种文字识别模型的训练方法、文字识别方法、装置及设备，用以解决文字识别模型训练成本高效率低的问题。

2、第一方面，本申请提供一种文字识别模型的训练方法，包括：

3、将待训练数据分别输入至第一文字识别模型以及第二文字识...

【技术保护点】

1.一种文字识别模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述第一预测值作为第一标签值，并将所述第二预测值作为第二标签值，以基于所述第一标签值对所述第二文字识别模型进行训练，并基于所述第二标签值对所述第一文字识别模型进行训练，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一训练预测值和所述第二标签值对所述第一文字识别模型进行训练，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述第一预测值作为第一标签值，并将所述第二预测值作为第二标签值，以基于所述第一标签值对所述第二文字识别模型进行...

【技术特征摘要】

1.一种文字识别模型的训练方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一训练预测值和所述第二标签值对所述第一文字识别模型进行训练，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述第一预测值作为第一标签值，并将所述第二预测值作为第二标签值，以基于所述第一标签值对所述第二文字识别模型进行训练，并基于所述第二标签值对所述第一文字识别模型进行训练，包括：

5.根据权利要求1-4中任一项所述的方法，其特征在于，在所述将待训练数据分别输入至第一文字识别模型以及第二文字识别模型，相应得到第一文字识别模型所输出的第一预测值以及所述第二文字...

【专利技术属性】
技术研发人员：陈科桦，
申请(专利权)人：交通银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人