System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练样本生成方法及电子设备技术_技高网

训练样本生成方法及电子设备技术

技术编号:40772119 阅读:2 留言:0更新日期:2024-03-25 20:19
本申请实施例提供了一种训练样本生成方法及电子设备。训练样本生成方法,包括:获得用于指示图像中的光影区域与除所述光影区域之外的其它区域的像素变化的像素变化趋势图,其中,所述光影区域包括所述图像中的阴影区域和/或反光区域;基于所述像素变化趋势图,对原始扫描文档图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描文档图像;根据所述原始扫描文档图像和所述模拟扫描文档图像,生成训练样本对。本申请实施例生成的训练样本对质量较好。

【技术实现步骤摘要】

本申请实施例涉及计算机,尤其涉及一种训练样本生成方法及电子设备


技术介绍

1、随着计算机技术的发展,在人们的日常生活和工作中经常有需要电子扫描文档的情况,例如,书籍电子化、发票报销、工作文档扫描打印、证件材料扫描件等等应用场景。

2、因专业的扫描仪价格昂贵,扫描软件应运而生。通过扫描软件,用户可以随时随地实现方便、低成本的文档扫描。伴随着扫描软件的广泛使用,扫描场景也越来越多样化。例如,在某些场景中,不需要针对扫描图像的对比度较大的增强滤镜的效果,只需将拍摄的扫描图像中的阴影以及反光去除即可。为此,需要与该需求相适配的训练样本,以对实现软件扫描的机器学习模型进行迭代更新。在现有的一种方式中,先搜集无阴影无反光且带文档底色的图像,然后利用专业的渲染软件(如unity3d等)来进行针对这类图像的阴影与反光的模拟。但是这种方式,一方面,涉及复杂的参数调节,效率较低,并且,通过参数调节获得的光影效果只能与当前图像匹配,导致灵活性较差;另一方面,通过渲染软件的参数模拟的光影效果在一定程度上会改变文档的背景底色,由其形成的训练样本对就引入了随机的颜色变化,将会导致后续的模型训练因此难以收敛。


技术实现思路

1、有鉴于此,本申请实施例提供一种训练样本生成方案,以至少部分解决上述问题。

2、根据本申请实施例的第一方面,提供了一种训练样本生成方法,包括:获得用于指示图像中的光影区域与除所述光影区域之外的其它区域的像素变化的像素变化趋势图,其中,所述光影区域包括所述图像中的阴影区域和/或反光区域;基于所述像素变化趋势图,对原始扫描文档图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描文档图像;根据所述原始扫描文档图像和所述模拟扫描文档图像,生成训练样本对。

3、根据本申请实施例的第二方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述方法对应的操作。

4、根据本申请实施例的第三方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法。

5、根据本申请实施例提供的方案,通过像素变化趋势图,可以确定某种光照情况下的阴影区域与无阴影区域(即其它区域)之间的像素变化情况,和/或,反光区域与无反光区域(即其它区域)之间的像素变化情况。基于此,可对某个原始扫描文档图像进行光影处理,该原始扫描文档图像可以为无阴影且无反光的图像,在此情况下,通过像素变化趋势图对该原始扫描文档图像进行光影处理,以为该图像中的部分区域增加阴影和/或反光,生成具有阴影区域和/或反光区域的模拟扫描文档图像。进而,结合原始扫描文档图像和模拟扫描文档图像,可以生成用于对实现软件扫描的机器学习模型进行训练的训练样本对。由此,一方面,不需人工进行长时间学习和复杂的渲染软件的参数调节,既减轻的人工操作负担,又提高了对图像进行光影处理的效率;另一方面,像素变化趋势图描述的是阴影和/或反光与其它部分的差异和变化趋势,可适用于各种情况的原始扫描文档图像,灵活性较高,而若像素变化趋势图包括多个,还可根据需求对原始扫描文档图像进行不同的光影处理,获得更多的模拟扫描文档图像,扩充训练样本的数量;再一方面,像素变化趋势图不会改变原始扫描文档图像的背景底色,也就不会带来像素偏差和随机的颜色变化,因而生成的训练样本对质量也较好,能够避免传统方式中的模型训练难以收敛的问题。

本文档来自技高网...

【技术保护点】

1.一种训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述像素变化趋势图通过以下方式生成:

3.根据权利要求2所述的方法,其中,所述基于所述模拟图中除所述阴影区域和所述反光区域之外的其它区域的像素均值,及,所述阴影区域和/或所述反光区域的像素值,获得像素变化趋势图,包括:

4.根据权利要求2或3所述的方法,其中,所述对纯色图像进行光影处理,获得具有阴影区域和/或反光区域的模拟图,包括:

5.根据权利要求4所述的方法,其中,所述光影处理还包括以下至少之一:背景纹理设置、背景颜色设置、遮挡物位置设置、遮挡物类型设置。

6.根据权利要求2或3所述的方法,其中所述其它区域通过以下方式确定:

7.根据权利要求2或3所述的方法,其中,所述纯色图像为纯白色图像。

8.根据权利要求1所述的方法,其中,所述基于所述像素变化趋势图,对原始扫描文档图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描文档图像,包括:

9.根据权利要求1所述的方法,其中,所述基于所述像素变化趋势图,对原始扫描文档图像进行光影处理,获得对应的、具有阴影区域和/或反光区域的模拟扫描文档图像,包括:

10.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

...

【技术特征摘要】

1.一种训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述像素变化趋势图通过以下方式生成:

3.根据权利要求2所述的方法,其中,所述基于所述模拟图中除所述阴影区域和所述反光区域之外的其它区域的像素均值,及,所述阴影区域和/或所述反光区域的像素值,获得像素变化趋势图,包括:

4.根据权利要求2或3所述的方法,其中,所述对纯色图像进行光影处理,获得具有阴影区域和/或反光区域的模拟图,包括:

5.根据权利要求4所述的方法,其中,所述光影处理还包括以下至少之一:背景纹理设置、背景颜色设置、遮挡物位置设置、遮挡物类型设置。

6.根据权利要求2或3所...

【专利技术属性】
技术研发人员:单一
申请(专利权)人:优视科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1