一种模型训练方法、文本去除方法及相关装置制造方法及图纸

技术编号：30974789 阅读：18 留言：0更新日期：2021-11-25 21:00

本公开提供了一种模型训练方法、文本去除方法及相关装置，模型训练方法用于训练作答文本检测模型，该作答文本检测模型包括第一神经网络和第二神经网络，该模型训练方法包括：基于第一作答试题图像和第一标签，训练第一神经网络，其中，第一标签用于指示第一作答试题图像中各像素点是否属于作答区域；基于第二作答试题图像、第一分类结果和第二标签，训练第二神经网络，其中，第一分类结果为第二作答试题图像中各像素点属于作答区域的分类结果，第二标签用于指示第二作答试题图像中各像素点是否属于作答文本。本公开实施例中提供的一个或多个技术方案，可以提高作答文本检测的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、文本去除方法及相关装置

[0001]本专利技术涉及人工智能领域，尤其涉及一种模型训练方法、文本去除方法及相关装置。

技术介绍

[0002]去除作答试题图像中的作答文本，对用户和拍照判题程序的提供者都有很大意义。对于用户来说，去除作答文本后，用户可以重新练习，以巩固学习效果。对于拍照判题程序的提供者来说，去除作答文本后，可以用于扩充题库。
[0003]现有去除作答文本的过程为：先采用通用目标检测方法检测作答试题图像中的作答文本，再去除检测到的作答文本。

技术实现思路

[0004]为了解决现有技术中的至少一个技术问题，本公开提供了一种模型训练方法、文本去除方法及相关装置；根据本公开的另一方面，一种模型训练方法，用于训练作答文本检测模型，所述作答文本检测模型包括第一神经网络和第二神经网络，其中，所述第一神经网络用于确定作答试题图像中各像素点属于作答区域的分类结果，所述第二神经网络用于基于所述作答试题图像和所述第一神经网络输出的所述分类结果，确定所述作答试题图像中各像素点属于作答文本的分类结果；所述模型训练方法包括：基于第一作答试题图像和第一标签，训练所述第一神经网络，其中，所述第一作答试题图像为用于训练的所述作答试题图像，所述第一标签用于指示所述第一作答试题图像中各像素点是否属于作答区域；基于第二作答试题图像、第一分类结果和第二标签，训练所述第二神经网络，其中，所述第二作答试题图像为用于训练的所述作答试题图像，所述第一分类结果为所述第二作答试题图像中各像素点属于作答区域的分类结果，...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，用于训练作答文本检测模型，所述作答文本检测模型包括第一神经网络和第二神经网络，其中，所述第一神经网络用于确定作答试题图像中各像素点属于作答区域的分类结果，所述第二神经网络用于基于所述作答试题图像和所述第一神经网络输出的所述分类结果，确定所述作答试题图像中各像素点属于作答文本的分类结果；所述模型训练方法包括：基于第一作答试题图像和第一标签，训练所述第一神经网络，其中，所述第一作答试题图像为用于训练的所述作答试题图像，所述第一标签用于指示所述第一作答试题图像中各像素点是否属于作答区域；基于第二作答试题图像、第一分类结果和第二标签，训练所述第二神经网络，其中，所述第二作答试题图像为用于训练的所述作答试题图像，所述第一分类结果为所述第二作答试题图像中各像素点属于作答区域的分类结果，所述第二标签用于指示所述第二作答试题图像中各像素点是否属于作答文本。2.根据权利要求1所述的模型训练方法，其特征在于，所述第一作答试题图像和所述第二作答试题图像中的试题文本均为打印体文本，所述第一作答试题图像和所述第二作答试题图像中的作答文本均为手写体文本。3.根据权利要求1所述的模型训练方法，其特征在于，所述第一标签为用于指示所述第一作答试题图像中各像素点是否属于作答区域的标注框；和/或，所述第二标签为所述第二作答试题图像与所述第二作答试题图像对应的空白试题图像之间的差分图像。4.根据权利要求1所述的模型训练方法，其特征在于，所述作答试题图像中各像素点属于作答区域的分类结果为所述作答试题图像中各像素点属于所述作答区域的得分图；和/或，所述作答试题图像中各像素点属于作答文本的分类结果为所述作答试题图像中各像素点属于所述作答文本的得分图。5.根据权利要求1所述的模型训练方法，其特征在于，所述第一神经网络包括：第一提取子网络，用于对所述作答试题图像进行特征提取，得到第一特征图，其中，所述第一特征图包含趋于区分所述作答试题图像中各像素点是否属于作答区域的特征；第一还原子网络，用于根据所述第一特征图，得到与所述作答试题图像大小一致的第一特征映射，其中，所述第一特征映射用于表示所述作答试题图像中各像素点属于作答区域的分类结果。6.根据权利要求5所述的模型训练方法，其特征在于，所述第一提取子网络包括：级联的多个残差块，其中，每个所述残差块输出一个特征图；上采样单元，用于将所述多个残差块输出的特征图上采样至大小一致后串联，以得到所述第一特征图。7.根据权利要求5所述的模型训练方法，其特征在于，所述第二神经网络包括：第二提取子网络，用于对所述作答试题图像进行特征提取处理，以得到第二特征图，所述第二特征图包含趋于区分所述作答试题图像中各像素点是否属于作答文本的特征；
特征融合单元，用于融合所述第一特征映射和所述第二特征图，以得到第三特征图；第二还原子网络，用于根据所述第三特征图得到与所述作答试题图像大小一致的第二道特征映射，其中，所述第二特征映射用于表示所述作答试题图像中各像素点属于作答文本的分类结果。8.根据权利要求7所述的模型训练方法，其特征在于，所述第一还原子网络，具体用于：对所述第一特征图进行至少一次还原处理，以得到所述第一特征映射，其中，每次所述还原处理包括至少一次卷积操作和至少一次反卷积操作；和/或，所述第二还原子网络，具体用于：对所述第三特征图进行至少一次还原处理，以得到所述第一特征映射，其中，每次所述还原处理包括至少一次卷积操作和至少一次反卷积操作。9.根据权利要求7所述的模型训练方法，其特征...

【专利技术属性】
技术研发人员：秦勇，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人