基于贴图技术进行小目标数据增强的方法、装置及介质制造方法及图纸

技术编号：41085337 阅读：3 留言：0更新日期：2024-04-25 13:47

本发明专利技术公开了一种基于贴图技术进行小目标数据增强的方法、装置及介质，涉及数据增强技术领域。所述方法包括：获取至少一个小目标图像；依次获取一带有标注文件的待增强数据作为第一图像，读取第一图像的宽W，高H；将所述小目标图像执行随机缩放后得到第二图像，然后读取第二图像的宽w，高h；随机获取第二图像在第一图像中的贴图区域，将第二图像与贴图区域自然融合，得到增加了小目标的图片；循环执行至增加的小目标达到指定数量；将全部新增的小目标的位置信息和所述标注文件中的标注信息进行累加，得到新的标注文件。使用本发明专利技术的方法增强后的训练数据对检测模型进行训练，可以提高模型对小目标的检出召回率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据增强，特别涉及一种基于贴图技术进行小目标数据增强的方法、装置及介质。

技术介绍

1、掷实心球、铅球是一项快速发力并且对身体协调性要求全面的中考体育项目，如何快速准确地检测出球落地时的位置是ai体育的第一目标。

2、现有模型对于小目标检测应用场景，虽然准确率可以达标(即检出的目标基本为正确目标)，但是容易产生漏检的情况(即有目标但未被检出)，当模型的召回率不满足要求时，现有方法是通过拍摄、网络查找等方式进行数据增强。然而，现有的数据增强方法能提高的召回率有限，仍然不能满足中考体育考试的召回率要求。

技术实现思路

1、本专利技术要解决的技术问题，在于提供一种基于贴图技术进行小目标数据增强的方法、装置及介质，基于贴图技术增加小目标在图片中的个数，从而增加小目标检测时的先验框个数，可达到更好的模型训练效果，提高小目标的检出召回率。

2、第一方面，本专利技术提供了一种基于贴图技术进行小目标数据增强的方法，包括：

3、步骤10、获取至少一个小目标图像；

4、步骤20、依次获取一带有标注文件的待增强数据作为第一图像，读取第一图像的宽w，高h；

5、步骤30、将所述小目标图像执行随机缩放后得到第二图像，然后读取第二图像的宽w，高h；随机获取第二图像在第一图像中的贴图区域，将所述贴图区域的alpha值修改为1减去第二图像的alpha值，然后将贴图区域的alpha值与第二图像的alpha值的乘积叠加，得到增加了小目标的图片；

6、步骤40、将全部新增的小目标的位置信息和所述标注文件中的标注信息进行累加，得到新的标注文件，增加了指定个数小目标的图片及新的标注文件即为增强后的模型训练数据，然后返回步骤20获取下一个带有标注文件的待增强数据，如获取不到待增强数据则结束步骤。

7、进一步地，所述步骤40中，随机获取第二图像在第一图像中的贴图区域，具体包括：

8、使用random函数随机获取第二图像在第一图像中的位置new_xmin，new_ymin∈[0，w-w]，[0，h-h]，得到new_xmax，new_ymax＝new_xmin+w，new_ymin+h，并且new_xmax，new_ymax∈[w，w]，[h，h]；

9、new_xmin，new_xmax，new_ymin，new_ymax构成第二图像在第一图像中的贴图区域。

10、进一步地，所述将贴图区域的alpha值与第二图像的alpha值的乘积叠加，具体包括：将贴图区域每个像素点的rgb三个通道的值分别与对应修改后的alpha值进行乘积，将第二图像对应像素点的rgb三个通道的值分别与第二图像的alpha值进行乘积，然后将两乘积叠加。

11、进一步地，使用opencv读取第一图像的宽w，高h，读取第二图像的宽w，高h。

12、第二方面，本专利技术提供了一种基于贴图技术进行小目标数据增强的装置，包括：贴图获取模块、训练数据获取模块、随机贴图模块以及标注文件更新模块；其中，

13、贴图获取模块，用于获取至少一个小目标图像；

14、训练数据获取模块，用于依次获取一带有标注文件的待增强数据作为第一图像，读取第一图像的宽w，高h；

15、随机贴图模块，用于将所述小目标图像执行随机缩放后得到第二图像，然后读取第二图像的宽w，高h；随机获取第二图像在第一图像中的贴图区域，将所述贴图区域的alpha值修改为1减去第二图像的alpha值，然后将贴图区域的alpha值与第二图像的alpha值的乘积叠加，得到增加了小目标的图片；循环执行至增加的小目标达到指定数量；

16、标注文件更新模块，用于将全部新增的小目标的位置信息和所述标注文件中的标注信息进行累加，得到新的标注文件，增加了指定个数小目标的图片及新的标注文件即为增强后的模型训练数据，然后返回训练数据获取模块获取下一个带有标注文件的待增强数据，如获取不到待增强数据则结束。

17、进一步地，所述随机贴图模块中，随机获取第二图像在第一图像中的贴图区域，具体包括：

18、使用random函数随机获取第二图像在第一图像中的位置new_xmin，new_ymin∈[0，w-w]，[0，h-h]，得到new_xmax，new_ymax＝new_xmin+w，new_ymin+h，并且new_xmax，new_ymax∈[w，w]，[h，h]；

19、new_xmin，new_xmax，new_ymin，new_ymax构成第二图像在第一图像中的贴图区域。

20、进一步地，所述随机贴图模块中，将贴图区域的alpha值与第二图像的alpha值的乘积叠加，具体包括：将贴图区域每个像素点的rgb三个通道的值分别与对应修改后的alpha值进行乘积，将第二图像对应像素点的rgb三个通道的值分别与第二图像的alpha值进行乘积，然后将两乘积叠加。

21、进一步地，使用opencv读取第一图像的宽w，高h，读取第二图像的宽w，高h。

22、第三方面，本专利技术提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面所述的方法。

23、本专利技术实施例中提供的技术方案，至少具有如下技术效果：

24、基于贴图技术对小目标检测模型的训练数据进行数据增强，增加小目标在图形中出现的个数，用数据增强用的训练数据再对小目标检测模型进行训练，可以显著提高小目标检测模型的召回率，大大提升了检测效果；通过将贴图区域的alpha值修改为1-第二图像的alpha值，然后将贴图区域的alpha值与第二图像的alpha值的乘积叠加，可以实现贴图与训练图像的自然融合，达到更好的训练效果，经实际测试，采用本方法增强后的数据训练的小目标检测模型，球类的召回率可达98％以上。

25、通过opencv计算机视觉库进行图像宽高信息的获取，再通过计算机程序自动在随机位置进行乘积叠加式贴图，可快速实现自动对训练数据进行数据增强。

26、上述说明仅是本专利技术技术方案的概述，为了能够更清楚了解本专利技术的技术手段，而可依照说明书的内容予以实施，并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂，以下特举本专利技术的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种基于贴图技术进行小目标数据增强的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于：所述步骤40中，随机获取第二图像在第一图像中的贴图区域，具体包括：

3.根据权利要求1或2所述的方法，其特征在于：所述将贴图区域的alpha值与第二图像的alpha值的乘积叠加，具体包括：将贴图区域每个像素点的RGB三个通道的值分别与对应修改后的alpha值进行乘积，将第二图像对应像素点的RGB三个通道的值分别与第二图像的alpha值进行乘积，然后将两乘积叠加。

4.根据权利要求1所述的方法，其特征在于：使用OpenCV读取第一图像的宽W，高H，读取第二图像的宽w，高h。

5.一种基于贴图技术进行小目标数据增强的装置，其特征在于，包括：贴图获取模块、训练数据获取模块、随机贴图模块以及标注文件更新模块；其中，

6.根据权利要求5所述的装置，其特征在于：所述随机贴图模块中，随机获取第二图像在第一图像中的贴图区域，具体包括：

7.根据权利要求5或6所述的装置，其特征在于：所述随机贴图模块中，将贴图区域的alp

8.根据权利要求5所述的装置，其特征在于：使用OpenCV读取第一图像的宽W，高H，读取第二图像的宽w，高h。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至4任一项所述的方法。

...

【技术特征摘要】

1.一种基于贴图技术进行小目标数据增强的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于：所述步骤40中，随机获取第二图像在第一图像中的贴图区域，具体包括：

3.根据权利要求1或2所述的方法，其特征在于：所述将贴图区域的alpha值与第二图像的alpha值的乘积叠加，具体包括：将贴图区域每个像素点的rgb三个通道的值分别与对应修改后的alpha值进行乘积，将第二图像对应像素点的rgb三个通道的值分别与第二图像的alpha值进行乘积，然后将两乘积叠加。

4.根据权利要求1所述的方法，其特征在于：使用opencv读取第一图像的宽w，高h，读取第二图像的宽w，高h。

5.一种基于贴图技术进行小目标数据增强的装置，其特征在于，包括：贴图获取模块、训练数据获取模块、随机贴图模...

【专利技术属性】
技术研发人员：李泽冰，章珠明，汪鸿彬，林世明，胡灿峰，
申请(专利权)人：恒鸿达福建体育科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人