System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 业务数据增强方法及装置、计算机设备和可读存储介质制造方法及图纸_技高网

业务数据增强方法及装置、计算机设备和可读存储介质制造方法及图纸

技术编号:40964820 阅读:4 留言:0更新日期:2024-04-18 20:44
本申请提供一种业务数据增强方法及装置、计算机设备和可读存储介质,涉及数据增强技术领域。本申请在得到背景图像集和与业务数据集对应的目标实例集后,会确定背景图像集中的每张背景图像的实例添加次数,并针对每张背景图像,从目标实例集处随机选取一个目标对象类别,并在与目标对象类别对应的目标图像子集处随机选取一个目标实例对象,接着将目标实例对象在目标图像子集中的图像内容粘贴覆盖到该背景图像中的目标添加位置处,而后重复执行前述几项步骤,直至该背景图像的已添加实例对象数目与实例添加次数保持一致,来得到伪业务数据集中的一张伪业务图像,使最终输出的扩增数据集实现实例对象类别平衡效果,有利于提升模型微调训练效果。

【技术实现步骤摘要】

本申请涉及数据增强,具体而言,涉及一种业务数据增强方法及装置、计算机设备和可读存储介质


技术介绍

1、随着科学技术发展,目标检测和实例分割是目前计算机视觉技术的重要应用方向,目前在使用coco等通用大型数据集训练计算机视觉模型后,通常需要利用包含实际业务所关注的特定目标类型的业务数据集对计算机视觉模型进行微调训练,才能确保微调训练后的计算机视觉模型能够更好地适用于具体业务场景下的目标检测/分割任务。

2、而对模型微调训练操作来说,业务数据集的获取和标注成本较高,尤其对于特定的生产和生活场景,很难获取足量的真实业务场景图像,同时也需消耗大量的人力资源来对获取到的真实业务场景图像进行人工标注,但业务数据集的丰富程度也起着非常重要的作用,倘若对应业务数据集中包含的场景过少,就很有可能影响模型训练效果,进而影响模型性能。

3、在此情况下,通常需要利用数据增强技术对原始业务数据集进行一系列的图像变换和修改,得到和原始业务数据不同的生成数据,来起到扩充数据集的目的。目前适用于业务场景的数据增强方案是直接从业务数据集所对应的目标实例集中随机抽取图像粘贴到待增强图像中的随机位置处,但值得注意的是,这种数据增强方案通常会因目标实例集中不同实例对象类别的业务实例对象数目不一致,对应业务实例对象数目越大的实例对象类别越容易被选中,导致最终得到的扩增数据集实质存在实例对象类别不平衡问题,不利于模型微调训练。


技术实现思路

1、有鉴于此,本申请的目的在于提供一种业务数据增强方法及装置、计算机设备和可读存储介质,能够在随机选取目标实例集的实例对象类别的基础上随机选取对应实例对象类别下的业务实例对象进行数据增强,确保最终得到的扩增数据集实现实例对象类别平衡效果,有利于提升模型微调训练效果。

2、为了实现上述目的,本申请实施例采用的技术方案如下:

3、第一方面,本申请提供一种业务数据增强方法,所述方法包括:

4、获取背景图像集和与业务数据集对应的目标实例集,其中所述目标实例集包括多个实例对象类别各自对应的图像子集,每个图像子集包括归属于同一实例对象类别的多个业务实例对象各自的业务实例图像和实例掩膜图像;

5、针对所述背景图像集包括的每张背景图像,确定该背景图像的实例添加次数;

6、从所述目标实例集所涉及的多个实例对象类别中随机选取一个目标对象类别,并在目标图像子集所涉及的多个业务实例对象中随机选取一个目标实例对象,其中所述目标图像子集与所述目标对象类别对应;

7、在该背景图像中确定所述目标实例对象的目标添加位置,并根据与所述目标实例对象对应的实例掩膜图像,将所述目标实例对象在对应业务实例图像中的图像内容粘贴覆盖到所述目标添加位置处;

8、检测该背景图像的已添加实例对象数目是否与所述实例添加次数保持一致;

9、若检测到该背景图像的已添加实例对象数目与所述实例添加次数保持一致,则将该背景图像作为伪业务数据集中的一张伪业务图像,否则跳转到所述从所述目标实例集所涉及的多个实例对象类别中随机选取一个目标对象类别的步骤继续执行;

10、输出由所述伪业务数据集和所述业务数据集组成的扩增数据集。

11、在可选的实施方式中,获取与业务数据集对应的目标实例集的步骤,包括:

12、针对所述业务数据集包括的每张已标注业务图像,根据该已标注业务图像的实例对象标注信息,对该已标注业务图像进行图像截取,得到该已标注业务图像所涉及的至少一个业务实例对象各自的业务实例图像和实例掩膜图像;

13、根据所述业务数据集中所有业务实例对象各自对应的实例对象类别,对所述所有业务实例对象各自的业务实例图像和实例掩膜图像进行图像分组处理,得到所述目标实例集。

14、在可选的实施方式中,针对所述背景图像集包括的每张背景图像,所述确定该背景图像的实例添加次数的步骤,包括:

15、针对每张背景图像,基于随机数生成算法在预设的实例添加数目区间内生成一个随机数,并将生成的随机数作为该背景图像的实例添加次数。

16、在可选的实施方式中,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

17、从该背景图像内的多个实例添加位置点中,随机选取一个实例添加位置点作为所述目标添加位置。

18、在可选的实施方式中,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

19、从该背景图像内的多个实例添加位置点中,查找未被该背景图像内的已添加实例对象覆盖的目标位置点;

20、若查找到至少一个目标添加位置点,则从查找到的所有目标添加位置点中随机选取一个目标位置点作为所述目标添加位置,否则从所述多个实例添加位置点中随机选取一个实例添加位置点作为所述目标添加位置。

21、在可选的实施方式中,针对每张背景图像,检测该背景图像内的多个实例添加位置点各自是否被该背景图像内的已添加实例对象覆盖的步骤,包括:

22、在该背景图像内确定所有已添加实例对象各自的对象区域边界框,其中所述对象区域边界框为对应已添加实例对象的覆盖区域的最小外接矩形框,或者所述对象区域边界框为对应已添加实例对象的实例掩膜图像在映射到该背景图像时的图像边缘框;

23、针对该背景图像内的每个实例添加位置点,检测该实例添加位置点是否处于任意一个对象区域边界框内;

24、若检测到该实例添加位置点处于任意一个对象区域边界框内时,则判定该实例添加位置点被已添加实例对象覆盖,否则判定该实例添加位置点属于未被已添加实例对象覆盖的目标位置点。

25、在可选的实施方式中,所述根据与所述目标实例对象对应的实例掩膜图像,将所述目标实例对象在对应业务实例图像中的图像内容粘贴覆盖到所述目标添加位置处的步骤,包括:

26、对所述目标实例对象所对应的业务实例图像进行随机图像增强处理,得到目标实例图像;

27、根据与所述目标实例对象对应的实例掩膜图像,从所述目标实例图像中提取与所述目标实例对象匹配的目标图像内容;

28、将所述目标图像内容的图像中心位置与所述目标添加位置进行位置对齐,并将所述目标图像内容粘贴到所述目标添加位置所在的背景图像中。

29、第二方面,本申请提供一种业务数据增强装置,所述装置包括:

30、图像集获取模块,用于获取背景图像集和与业务数据集对应的目标实例集,其中所述目标实例集包括多个实例对象类别各自对应的图像子集,每个图像子集包括归属于同一实例对象类别的多个业务实例对象各自的业务实例图像和实例掩膜图像;

31、添加次数确定模块,用于针对所述背景图像集包括的每张背景图像,确定该背景图像的实例添加次数;

32、实例对象选取模块,用于从所述目标实例集本文档来自技高网...

【技术保护点】

1.一种业务数据增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取与业务数据集对应的目标实例集的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,针对所述背景图像集包括的每张背景图像,所述确定该背景图像的实例添加次数的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

5.根据权利要求1所述的方法,其特征在于,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

6.根据权利要求5所述的方法,其特征在于,针对每张背景图像,检测该背景图像内的多个实例添加位置点各自是否被该背景图像内的已添加实例对象覆盖的步骤,包括:

7.根据权利要求1-6中任意一项所述的方法,其特征在于,所述根据与所述目标实例对象对应的实例掩膜图像,将所述目标实例对象在对应业务实例图像中的图像内容粘贴覆盖到所述目标添加位置处的步骤,包括:

8.一种业务数据增强装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有可被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现权利要求1-7中任意一项所述的业务数据增强方法。

10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备执行时,实现权利要求1-7中任意一项所述的业务数据增强方法。

...

【技术特征摘要】

1.一种业务数据增强方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取与业务数据集对应的目标实例集的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,针对所述背景图像集包括的每张背景图像,所述确定该背景图像的实例添加次数的步骤,包括:

4.根据权利要求1所述的方法,其特征在于,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

5.根据权利要求1所述的方法,其特征在于,每张背景图像可确定呈网格状分布的多个实例添加位置点,则所述在该背景图像中确定所述目标实例对象的目标添加位置的步骤,包括:

6.根据权利要求5所述的方法,其特征在于,针对每张背景图像,检...

【专利技术属性】
技术研发人员:安毅邹鹏宇胡淑萍董培庞建新
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1