System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 训练数据生成方法、图像检测方法、图像分类方法及装置制造方法及图纸_技高网

训练数据生成方法、图像检测方法、图像分类方法及装置制造方法及图纸

技术编号:41299917 阅读:2 留言:0更新日期:2024-05-13 14:47
本公开提供了一种训练数据生成方法、图像检测方法、图像分类方法及装置。训练数据生成方法包括:获取初始的训练数据集和包括前景物体图像的数据集,其中,所述初始的训练数据集包括前景物体在真实背景下的实物场景图像;将所述数据集中的前景物体图像合成到所述实物场景图像的背景图像中,得到初步合成图像;对所述初步合成图像进行特定处理,得到最终合成图像。

【技术实现步骤摘要】

本公开总体说来涉及数据处理领域,更具体地讲,涉及一种训练数据的生成方法、图像检测方法、图像分类方法及装置。


技术介绍

1、计算机视觉任务(如检测任务、分类任务),由于模型大小的快速增加,往往需要很多具有精确标注(如包括标注框)的数据,来进行各种任务。精确标注的数据往往是模型表现的决定因素。例如,在自动驾驶等行业当中,研究者们往往建立了从数据收集、到自动标注到错误反馈的闭环。

2、然而在实际计算机视觉任务中,特别是在多样化的场景下,往往没有足够多的成本和时间去收集大量的数据。这就需要使用少量数据,来进行视觉任务,如检测或分类任务。然而,直接使用原始小规模的数据往往不能带来很好的检测或分类效果。基于此,通常会使用一些数据增强的技术合成数据,来扩充原始数据,以增强模型的表现。

3、然而,传统的数据增强一般只包括裁剪、形变或随机裁剪物体等一些比较基础的图像增强算法,产生出来的新图像往往从视觉上看非常奇怪,与实际图像差距较大。此外,可通过使用游戏引擎合成数据,来辅助例如自动驾驶领域的模型训练。另有一部分方法,通过一些简单的ps处理,生成质量较差的合成数据,这些合成数据一般只用于文字相关任务的训练中,泛化性较差。

4、合成数据的质量对于计算机视觉任务至关重要,因此,需要一种高效高质量地合成训练数据的方法。


技术实现思路

1、本公开的示例性实施例在于提供一种训练数据的生成方法、图像检测方法、图像分类方法及装置,其能够自动高效高质量地合成出更接近真实场景的训练数据。

2、根据本公开的示例性实施例,提供一种训练数据的生成方法,包括:获取初始的训练数据集和包括前景物体图像的数据集,其中,所述初始的训练数据集包括前景物体在真实背景下的实物场景图像;将所述数据集中的前景物体图像合成到所述实物场景图像的背景图像中,得到初步合成图像;对所述初步合成图像进行特定处理,得到最终合成图像。

3、可选地,所述特定处理包括:图像和谐化处理和/或自然因素模拟处理;

4、其中,所述自然因素模拟处理用于模拟在特定自然因素下的成像效果。

5、可选地,所述特定自然因素的类型包括:天气状况和/或光照状态。

6、可选地,对所述初步合成图像进行特定处理,得到最终合成图像的步骤包括:对所述初步合成图像随机进行图像和谐化处理和自然因素模拟处理之中的至少一种处理。

7、可选地,对所述初步合成图像随机进行图像和谐化处理和自然因素模拟处理之中的至少一种处理的步骤包括:对所述初步合成图像随机进行图像和谐化处理、天气状况模拟处理、光照状态模拟处理之中的至少一种处理;其中,所述天气状况模拟处理用于模拟在特定天气状况下的成像效果,所述光照状态模拟处理用于模拟在特定光照状态下的成像效果。

8、可选地,对所述初步合成图像进行天气状况模拟处理的步骤包括:在所述初步合成图像上添加用于模拟出现至少一种特定天气状况的噪声,以呈现出在所述至少一种特定天气状况下成像的效果。

9、可选地,对所述初步合成图像进行光照状态模拟处理的步骤包括:在所述初步合成图像中添加光源,和/或改变所述初步合成图像的至少部分区域的亮度值以呈现出过曝光或欠曝光的成像效果。

10、可选地,还包括:从所述实物场景图像中去除前景物体,并对去除了前景物体的实物场景图像进行修补,得到所述实物场景图像的背景图像。

11、可选地,所述初始的训练数据集包括:所述实物场景图像及其对应的标注;其中,所述生成方法还包括:为所述最终合成图像添加对应的标注。

12、可选地,所述标注用于指示前景物体在图像中的位置信息;其中,为所述最终合成图像添加对应的标注的步骤包括:基于所述前景物体图像被合成到所述背景图像中的位置,为所述最终合成图像添加对应的标注。

13、根据本公开的示例性实施例,提供一种图像检测方法,包括:通过执行如上所述的生成方法的步骤得到所述最终合成图像;基于所述初始的训练数据集和合成的训练数据集,训练图像检测模型,其中,所述合成的训练数据集包括所述最终合成图像;基于训练好的图像检测模型执行图像检测任务。

14、可选地,所述初始的训练数据集包括:所述实物场景图像及其对应的标注;其中,所述合成的训练数据集包括:所述最终合成图像及其对应的标注。

15、根据本公开的示例性实施例,提供一种图像分类方法,包括:通过执行如上所述的生成方法的步骤得到所述最终合成图像;基于所述初始的训练数据集和合成的训练数据集,训练图像分类模型,其中,所述合成的训练数据集包括所述最终合成图像;基于训练好的图像分类模型执行图像分类任务。

16、可选地,所述初始的训练数据集包括:所述实物场景图像及其对应的标注;其中,所述合成的训练数据集包括:所述最终合成图像及其对应的标注。

17、根据本公开的示例性实施例,提供一种训练数据的生成装置,包括:数据集获取单元,被配置为获取初始的训练数据集和包括前景物体图像的数据集,其中,所述初始的训练数据集包括前景物体在真实背景下的实物场景图像;初步合成单元,被配置为从数据集获取单元接收所述初始的训练数据集和所述数据集,并将所述数据集中的前景物体图像合成到所述实物场景图像的背景图像中,得到初步合成图像;后处理单元,被配置为从初步合成单元接收所述初步合成图像,并对所述初步合成图像进行特定处理,得到最终合成图像。

18、可选地,所述特定处理包括:图像和谐化处理和/或自然因素模拟处理;其中,所述自然因素模拟处理用于模拟在特定自然因素下的成像效果。

19、可选地,所述特定自然因素的类型包括:天气状况和/或光照状态。

20、可选地,后处理单元被配置为:对所述初步合成图像随机进行图像和谐化处理和自然因素模拟处理之中的至少一种处理。

21、可选地,后处理单元被配置为:对所述初步合成图像随机进行图像和谐化处理、天气状况模拟处理、光照状态模拟处理之中的至少一种处理;其中,所述天气状况模拟处理用于模拟在特定天气状况下的成像效果,所述光照状态模拟处理用于模拟在特定光照状态下的成像效果。

22、可选地,后处理单元被配置为:在所述初步合成图像上添加用于模拟出现至少一种特定天气状况的噪声,以呈现出在所述至少一种特定天气状况下成像的效果。

23、可选地,后处理单元被配置为:在所述初步合成图像中添加光源,和/或改变所述初步合成图像的至少部分区域的亮度值以呈现出过曝光或欠曝光的成像效果。

24、可选地,初步合成单元还被配置为:从所述实物场景图像中去除前景物体,并对去除了前景物体的实物场景图像进行修补,得到所述实物场景图像的背景图像。

25、可选地,所述初始的训练数据集包括:所述实物场景图像及其对应的标注;其中,所述生成装置还包括:标注单元,被配置为为所述最终合成图像添加对应的标注。

26、可选地,所述标注用于指示前景物体在图像中的位置信息;其中,标注本文档来自技高网...

【技术保护点】

1.一种训练数据的生成方法,其特征在于,包括:

2.如权利要求1所述的生成方法,其特征在于,所述特定处理包括:图像和谐化处理和/或自然因素模拟处理;

3.如权利要求2所述的生成方法,其特征在于,所述特定自然因素的类型包括:天气状况和/或光照状态。

4.如权利要求2所述的生成方法,其特征在于,对所述初步合成图像进行特定处理,得到最终合成图像的步骤包括:

5.如权利要求4所述的生成方法,其特征在于,对所述初步合成图像随机进行图像和谐化处理和自然因素模拟处理之中的至少一种处理的步骤包括:

6.一种图像检测方法,其特征在于,包括:

7.一种图像分类方法,其特征在于,包括:

8.一种训练数据的生成装置,其特征在于,包括:

9.一种包括至少一个计算装置和至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至5中的任一权利要求所述的训练数据的生成方法。

10.一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至5中任一项所述的训练数据的生成方法。

...

【技术特征摘要】

1.一种训练数据的生成方法,其特征在于,包括:

2.如权利要求1所述的生成方法,其特征在于,所述特定处理包括:图像和谐化处理和/或自然因素模拟处理;

3.如权利要求2所述的生成方法,其特征在于,所述特定自然因素的类型包括:天气状况和/或光照状态。

4.如权利要求2所述的生成方法,其特征在于,对所述初步合成图像进行特定处理,得到最终合成图像的步骤包括:

5.如权利要求4所述的生成方法,其特征在于,对所述初步合成图像随机进行图像和谐化处理和自然因素模拟处理之中的至少一种处理的步骤包括:

<...

【专利技术属性】
技术研发人员:张晨麟冯小雪
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1