一种模型训练方法、文本去除方法及相关装置制造方法及图纸

技术编号:30974789 阅读:18 留言:0更新日期:2021-11-25 21:00
本公开提供了一种模型训练方法、文本去除方法及相关装置,模型训练方法用于训练作答文本检测模型,该作答文本检测模型包括第一神经网络和第二神经网络,该模型训练方法包括:基于第一作答试题图像和第一标签,训练第一神经网络,其中,第一标签用于指示第一作答试题图像中各像素点是否属于作答区域;基于第二作答试题图像、第一分类结果和第二标签,训练第二神经网络,其中,第一分类结果为第二作答试题图像中各像素点属于作答区域的分类结果,第二标签用于指示第二作答试题图像中各像素点是否属于作答文本。本公开实施例中提供的一个或多个技术方案,可以提高作答文本检测的准确性。性。性。

【技术实现步骤摘要】
一种模型训练方法、文本去除方法及相关装置


[0001]本专利技术涉及人工智能领域,尤其涉及一种模型训练方法、文本去除方法及相关装置。

技术介绍

[0002]去除作答试题图像中的作答文本,对用户和拍照判题程序的提供者都有很大意义。对于用户来说,去除作答文本后,用户可以重新练习,以巩固学习效果。对于拍照判题程序的提供者来说,去除作答文本后,可以用于扩充题库。
[0003]现有去除作答文本的过程为:先采用通用目标检测方法检测作答试题图像中的作答文本,再去除检测到的作答文本。

技术实现思路

[0004]为了解决现有技术中的至少一个技术问题,本公开提供了一种模型训练方法、文本去除方法及相关装置;根据本公开的另一方面,一种模型训练方法,用于训练作答文本检测模型,所述作答文本检测模型包括第一神经网络和第二神经网络,其中,所述第一神经网络用于确定作答试题图像中各像素点属于作答区域的分类结果,所述第二神经网络用于基于所述作答试题图像和所述第一神经网络输出的所述分类结果,确定所述作答试题图像中各像素点属于作答文本的分类结果;所述模型训练方法包括:基于第一作答试题图像和第一标签,训练所述第一神经网络,其中,所述第一作答试题图像为用于训练的所述作答试题图像,所述第一标签用于指示所述第一作答试题图像中各像素点是否属于作答区域;基于第二作答试题图像、第一分类结果和第二标签,训练所述第二神经网络,其中,所述第二作答试题图像为用于训练的所述作答试题图像,所述第一分类结果为所述第二作答试题图像中各像素点属于作答区域的分类结果,所述第二标签用于指示所述第二作答试题图像中各像素点是否属于作答文本。
[0005]根据本公开的另一方面,提供了一种文本去除方法,包括:将待处理图像输入作答文本检测模型,以得到所述待处理图像中各像素点属于作答文本的分类结果,其中,所述待处理图像为待去除作答文本的作答试题图像,所述作答文本检测模型根据本公开实施例中任一所述模型训练方法训练得到;根据所述待处理图像中各像素点属于作答文本的分类结果,去除所述待处理图像中的作答文本。
[0006]根据本公开的另一方面,提供了一种训练装置,用于训练作答文本检测模型,所述作答文本检测模型包括第一神经网络和第二神经网络,其中,所述第一神经网络用于确定作答试题图像中各像素点属于作答区域的分类结果,所述第二神经网络用于基于所述作答
试题图像和所述第一神经网络输出的所述分类结果确定所述作答试题图像中各像素点属于作答文本的分类结果;所述训练装置包括:第一训练模块,基于第一作答试题图像和第一标签,训练所述第一神经网络,其中,所述第一作答试题图像为用于训练的所述作答试题图像,所述第一标签用于指示所述第一作答试题图像中各像素点是否属于作答区域;第二训练模块,基于第二作答试题图像、第一分类结果和第二标签,训练所述第二神经网络,其中,所述第二作答试题图像为用于训练的所述作答试题图像,所述第一分类结果为所述第二作答试题图像中各像素点属于作答区域的分类结果,所述第二标签用于指示所述第二作答试题图像中各像素点是否属于作答文本。
[0007]根据本公开的另一方面,提供了一种文本去除装置,包括:像素分类模型,用于将待处理图像输入作答文本检测模型,以得到所述待处理图像中各像素点属于作答文本的分类结果,其中,所述待处理图像为待去除作答文本的作答试题图像,所述作答文本检测模型根据本公开实施例中任一所述模型训练方法训练得到;文本去除模块,用于根据所述待处理图像中各像素点属于作答文本的分类结果,去除所述待处理图像中的作答文本。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:处理器;以及,存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据本公开实施例中任一所述的方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开实施例中任一所述的方法。
[0010]本公开实施例中提供的一个或多个技术方案,经训练的作答文本检测模型,可以通过第二神经网络基于第一神经网络确定的作答试题图像中各像素点属于作答区域的分类结果确定所述作答试题图像中各像素点属于作答文本的分类结果,使得基于各像素点属于作答文本的分类结果得到的作答文本用采用通用目标检测方法检测作答试题图像中的作答文本更为精确。因此,可以提高作答文本检测的准确性,进而提高作答文本去除的精准度。
附图说明
[0011]附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
[0012]图1示出了根据本公开示例性实施例的可以在其中实施本文描述的各种方法的应用场景示意图;图2示出了根据本公开示例性实施例的作答文本检测模型的示意性框图;图3示出了根据本公开示例性实施例的模型训练方法的流程图;图4示出了根据本公开示例性实施例的手机拍摄作答试题图像的示意图;
图5示出了根据本公开示例性实施例的模型训练方法的子流程图;图6示出了根据本公开示例性实施例的模型训练方法的另一种子流程图;图7示出了根据本公开示例性实施例的作答文本检测模型的另一种示意性框图;图8示出了根据本公开示例性实施例的文本去除方法的流程图;图9示出了根据本公开示例性实施例的训练装置的示意性框图;图10示出了根据本公开示例性实施例的文本去除装置的示意性框图;图11示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0013]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0014]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0015]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0016]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0017]本公开实施方式中的多个装置之间所交互的消息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,用于训练作答文本检测模型,所述作答文本检测模型包括第一神经网络和第二神经网络,其中,所述第一神经网络用于确定作答试题图像中各像素点属于作答区域的分类结果,所述第二神经网络用于基于所述作答试题图像和所述第一神经网络输出的所述分类结果,确定所述作答试题图像中各像素点属于作答文本的分类结果;所述模型训练方法包括:基于第一作答试题图像和第一标签,训练所述第一神经网络,其中,所述第一作答试题图像为用于训练的所述作答试题图像,所述第一标签用于指示所述第一作答试题图像中各像素点是否属于作答区域;基于第二作答试题图像、第一分类结果和第二标签,训练所述第二神经网络,其中,所述第二作答试题图像为用于训练的所述作答试题图像,所述第一分类结果为所述第二作答试题图像中各像素点属于作答区域的分类结果,所述第二标签用于指示所述第二作答试题图像中各像素点是否属于作答文本。2.根据权利要求1所述的模型训练方法,其特征在于,所述第一作答试题图像和所述第二作答试题图像中的试题文本均为打印体文本,所述第一作答试题图像和所述第二作答试题图像中的作答文本均为手写体文本。3.根据权利要求1所述的模型训练方法,其特征在于,所述第一标签为用于指示所述第一作答试题图像中各像素点是否属于作答区域的标注框;和/或,所述第二标签为所述第二作答试题图像与所述第二作答试题图像对应的空白试题图像之间的差分图像。4.根据权利要求1所述的模型训练方法,其特征在于,所述作答试题图像中各像素点属于作答区域的分类结果为所述作答试题图像中各像素点属于所述作答区域的得分图;和/或,所述作答试题图像中各像素点属于作答文本的分类结果为所述作答试题图像中各像素点属于所述作答文本的得分图。5.根据权利要求1所述的模型训练方法,其特征在于,所述第一神经网络包括:第一提取子网络,用于对所述作答试题图像进行特征提取,得到第一特征图,其中,所述第一特征图包含趋于区分所述作答试题图像中各像素点是否属于作答区域的特征;第一还原子网络,用于根据所述第一特征图,得到与所述作答试题图像大小一致的第一特征映射,其中,所述第一特征映射用于表示所述作答试题图像中各像素点属于作答区域的分类结果。6.根据权利要求5所述的模型训练方法,其特征在于,所述第一提取子网络包括:级联的多个残差块,其中,每个所述残差块输出一个特征图;上采样单元,用于将所述多个残差块输出的特征图上采样至大小一致后串联,以得到所述第一特征图。7.根据权利要求5所述的模型训练方法,其特征在于,所述第二神经网络包括:第二提取子网络,用于对所述作答试题图像进行特征提取处理,以得到第二特征图,所述第二特征图包含趋于区分所述作答试题图像中各像素点是否属于作答文本的特征;
特征融合单元,用于融合所述第一特征映射和所述第二特征图,以得到第三特征图;第二还原子网络,用于根据所述第三特征图得到与所述作答试题图像大小一致的第二道特征映射,其中,所述第二特征映射用于表示所述作答试题图像中各像素点属于作答文本的分类结果。8.根据权利要求7所述的模型训练方法,其特征在于,所述第一还原子网络,具体用于:对所述第一特征图进行至少一次还原处理,以得到所述第一特征映射,其中,每次所述还原处理包括至少一次卷积操作和至少一次反卷积操作;和/或,所述第二还原子网络,具体用于:对所述第三特征图进行至少一次还原处理,以得到所述第一特征映射,其中,每次所述还原处理包括至少一次卷积操作和至少一次反卷积操作。9.根据权利要求7所述的模型训练方法,其特征...

【专利技术属性】
技术研发人员:秦勇
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1