模型训练方法、文本识别方法、电子设备及计算机程序产品技术

技术编号：43094462 阅读：12 留言：0更新日期：2024-10-26 09:40

本发明专利技术公开了一种模型训练方法、文本识别方法、电子设备及计算机程序产品。模型训练方法包括：获取训练样本集；训练样本集中的训练样本包括以下一项或多项：第一状态参数、动作参数、奖励参数和第二状态参数；其中，第一状态参数表征样本图像中的文本检测框内的第一图像特征，动作参数表征第二模型针对第一状态参数输出的用于调整文本检测框的调整动作，第二状态参数表征基于调整动作调整后的文本检测框内的第二图像特征，奖励参数表征基于第二图像特征的文本识别结果输出的奖励值；基于训练样本集训练第一模型，在设定训练步长后，将第一模型的参数复制给第二模型，以更新第二模型的参数，第二模型用于根据文本检测框的状态参数输出调整动作。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种模型训练方法、文本识别方法、电子设备及计算机程序产品。

技术介绍

1、光学字符识别(optical character recognition，ocr)包括文本检测和文本识别两个步骤，需要分别训练文本识别模型与文本检测模型，这两个模型均对训练数据集量级提出较高要求，数据采集与标注成本大，训练时间长。

技术实现思路

1、有鉴于此，本专利技术实施例提供了一种模型训练方法、文本识别方法、电子设备及计算机程序产品。

2、本专利技术实施例的技术方案是这样实现的：

3、一方面，本专利技术实施例提供了一种模型训练方法，该方法包括：

4、获取训练样本集；所述训练样本集中的训练样本包括以下一项或多项：第一状态参数、动作参数、奖励参数和第二状态参数；其中，所述第一状态参数表征样本图像中的文本检测框内的第一图像特征，所述动作参数表征第二模型针对所述第一状态参数输出的用于调整所述文本检测框的调整动作，所述第二状态参数表征基于所述调整动作调整后的...

【技术保护点】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一状态参数和所述第二状态参数包括所述文本检测框内的图像特征和所述文本检测框的历史调整动作的动作特征。

3.根据权利要求1所述的方法，其特征在于，所述获取训练样本集，包括：

4.根据权利要求1所述的方法，其特征在于，所述奖励值计算公式为：

5.一种基于权利要求1至4任一项所述方法训练得到的第二模型的文本识别方法，其特征在于，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.一种电子设备，包括存...

【技术特征摘要】

1.一种模型训练方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，所述获取训练样本集，包括：

4.根据权利要求1所述的方法，其特征在于，所述奖励值计算公式为：

5.一种基于权利要求1至4任一项所述方法训练得到的第二模型的文本识别方法，其特征在于，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特...

【专利技术属性】
技术研发人员：冯俊兰，李文蔚，李一龙，
申请(专利权)人：中国移动通信有限公司研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人