System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练样本生成方法、模型训练方法、电子设备及存储介质技术_技高网

训练样本生成方法、模型训练方法、电子设备及存储介质技术

技术编号:40738670 阅读:5 留言:0更新日期:2024-03-25 19:59
本申请实施例提供一种训练样本生成方法、模型训练方法、电子设备及存储介质。训练样本生成方法包括:从原始样本集合中采集原始扫描样本图像,及从像素变化趋势图集合中采集像素变化趋势图,像素变化趋势图用于指示图像中的光影区域与除光影区域之外的其它区域的像素变化,光影区域包括图像中的阴影区域和/或反光区域;对原始扫描样本图像进行随机分辨率调整,获得调整后样本图像;基于像素变化趋势图,对调整后样本图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描样本图像;根据调整后样本图像和模拟扫描样本图像,生成用于对机器学习模型进行线上训练的训练样本对,机器学习模型用于对扫描图像进行处理。

【技术实现步骤摘要】

本申请实施例涉及计算机,尤其涉及一种训练样本生成方法、模型训练方法、电子设备及存储介质


技术介绍

1、随着计算机技术的发展,在人们的日常生活和工作中经常有需要电子扫描文档的情况,例如,书籍电子化、发票报销、工作文档扫描打印、证件材料扫描件等等应用场景。

2、因专业的扫描仪价格昂贵,扫描软件应运而生。通过扫描软件,用户可以随时随地实现方便、低成本的文档扫描。伴随着扫描软件的广泛使用,扫描场景也越来越多样化。例如,在某些场景中,不需要针对扫描图像的对比度较大的增强滤镜的效果,只需将拍摄的扫描图像中的阴影以及反光去除即可。为此,需要与该需求相适配的训练样本,以对实现软件扫描的机器学习模型进行迭代更新。在现有的一种方式中,是对带阴影和/或反光的原始扫描图像进行增强滤镜处理,将获得的增强后扫描图像与原始扫描图像组成图像对,来对实现软件扫描的机器学习模型进行训练。

3、但是,采用这种增强滤镜处理的方式,不仅会去除阴影和/或反光,而且也会将原始扫描图像中的原始信息,如,图像底色、纹理、风格等等信息,一并去除掉,从而使得使用此类训练样本训练获得的机器学习模型不能有效还原扫描图像的真实样貌,还原效果较差。

4、因此,如何生成能够对上述机器学习模型进行有效训练,以使训练获得的模型具有较好还原效果的训练样本,成为亟待解决的问题。


技术实现思路

1、有鉴于此,本申请实施例提供一种训练样本生成及模型训练方案,以至少部分解决上述问题。

2、根据本申请实施例的第一方面,提供了一种训练样本生成方法,包括:从原始样本集合中采集原始扫描样本图像,及从像素变化趋势图集合中采集像素变化趋势图,其中,所述像素变化趋势图用于指示图像中的光影区域与除所述光影区域之外的其它区域的像素变化,所述光影区域包括所述图像中的阴影区域和/或反光区域;对所述原始扫描样本图像进行随机分辨率调整,获得调整后样本图像;基于所述像素变化趋势图,对所述调整后样本图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描样本图像;根据所述调整后样本图像和所述模拟扫描样本图像,生成用于对机器学习模型进行线上训练的训练样本对,其中,所述机器学习模型用于对扫描图像进行处理。

3、根据本申请实施例中的第二方面,提供了一种模型训练方法,用于对扫描图像进行处理的机器学习模型进行在线训练,所述方法包括:获取训练样本对,其中,所述训练样本对中包括:基于原始扫描样本图像进行随机分辨率调整后的图像,和,基于像素变化趋势图对所述调整后的图像进行光影处理后获得的、具有阴影区域和/或反光区域的图像;基于所述训练样本对和预设的损失函数,对所述机器学习模型进行在线训练。

4、根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述方法对应的操作。

5、根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法。

6、根据本申请实施例提供的方案,针对用于对扫描图像进行处理的机器学习模型的训练,在为其生成训练样本时,会基于像素变化趋势图对原始扫描样本图像进行光影处理,根据光影处理生成模拟扫描样本图像,并且,会对原始扫描样本图像进行随机分辨率调整,生成调整后样本图像。再基于模拟扫描样本图像和调整后样本图像,生成用于对机器学习模型进行训练的训练样本对。其中,通过光影处理,能够对原始扫描样本图像增加阴影区域和/或反光区域,使得生成的模拟扫描样本图像具有阴影区域和/或反光区域,由此,机器学习模型通过对该训练样本对的学习,使得训练完成的模型既能够有效去除图像中的阴影和/或反光,又能够避免对图像中的其它原始信息,如底色、纹理、风格等的不当去除,达到了有效还原图像原始样貌的效果。而通过对原始扫描样本图像进行随机分辨率调整处理,可以使得样本图像具有更丰富多样的分辨率,样本覆盖面更广,机器学习模型通过学习,可以在后续训练完成后能够对各种不同分辨率的图像具有更好的兼容处理能力,以及更好的还原效果。

本文档来自技高网...

【技术保护点】

1.一种训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,

3.根据权利要求2所述的方法,其中,所述对所述原始扫描样本图像进行随机分辨率调整,包括:

4.根据权利要求1-3任一项所述的方法,其中,所述像素变化趋势图集合通过以下方式生成:

5.根据权利要求4所述的方法,其中,所述方法还包括:

6.根据权利要求4所述的方法,其中,所述原始像素变化趋势图通过以下方式生成:

7.根据权利要求6所述的方法,其中,所述对纯色图像进行光影处理,获得具有阴影区域和/或反光区域的模拟图,包括:

8.根据权利要求7所述的方法,其中,所述光影处理还包括以下至少之一:背景纹理设置、背景颜色设置、遮挡物位置设置、遮挡物类型设置。

9.一种模型训练方法,用于对扫描图像进行处理的机器学习模型进行在线训练,所述方法包括:

10.根据权利要求9所述的方法,其中,所述预设的损失函数包括以下至少之一:用于评估像素点还原程度的损失函数、用于评估图像风格还原程度的损失函数。

11.根据权利要求10所述的方法,其中,所述预设的损失函数还包括:用于评估图像整体还原程度的损失函数。

12.根据权利要求9-11任一项所述的方法,其中,所述训练样本对通过如权利要求1-8任一项所述的方法生成。

13.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

14.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-12中任一所述的方法。

...

【技术特征摘要】

1.一种训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,

3.根据权利要求2所述的方法,其中,所述对所述原始扫描样本图像进行随机分辨率调整,包括:

4.根据权利要求1-3任一项所述的方法,其中,所述像素变化趋势图集合通过以下方式生成:

5.根据权利要求4所述的方法,其中,所述方法还包括:

6.根据权利要求4所述的方法,其中,所述原始像素变化趋势图通过以下方式生成:

7.根据权利要求6所述的方法,其中,所述对纯色图像进行光影处理,获得具有阴影区域和/或反光区域的模拟图,包括:

8.根据权利要求7所述的方法,其中,所述光影处理还包括以下至少之一:背景纹理设置、背景颜色设置、遮挡物位置设置、遮挡物类型设置。

9.一种模型训...

【专利技术属性】
技术研发人员:单一
申请(专利权)人:优视科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1