一种适用于任意角度旋转标注的图像增广方法和装置制造方法及图纸

技术编号：40424477 阅读：18 留言：0更新日期：2024-02-20 22:44

本申请提供了一种适用于任意角度旋转标注的图像增广方法和装置，通过对原始目标框内的目标进行分割，得到目标连通域，并对目标连通域内所有像素点坐标进行旋转变化，最后计算旋转之后的像素点在X方向、Y方向的坐标最小值和最大值作为新目标框的左上顶点坐标和右下顶点坐标。对于样本数量很少、目标角度固定的图像数据集，使用本申请可以产生大量新的训练样本，实现图像场景中可能出现的不同角度目标的全覆盖，有效节约了收集和标注图像数据集带来的时间、人力、资金等成本。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，具体涉及一种适用于任意角度旋转标注的图像增广方法和装置。

技术介绍

1、随着人工智能技术和并行计算能力的快速发展，深度学习在目标检测、识别和跟踪等领域得到了广泛应用。高质量的带标注图像数据集是深度学习解决工程问题的基本保障，但是收集和标注图像数据集是一个耗时耗力且代价昂贵的过程，而图像增广技术可以有效解决深度学习基于小样本数据的训练问题。在航拍图像车辆、船舶的检测、跟踪中，为了覆盖场景中可能出现的不同角度目标，通常对标注图像进行旋转来实现数据增广。当前大部分公开的图像数据集都是基于正框标注的，因此对标注图像旋转时利用原始目标框四个顶点坐标，求出旋转之后对应的四个顶点坐标，分别取x方向、y方向的最小值和最大值作为旋转之后新目标框的左上顶点和右下顶点。但是这种方法只能适应某些特定角度如90°、180°、270°等，当旋转角度为任意角度时会出现旋转后新目标框不能准确贴合实际目标的情况。

技术实现思路

1、针对上述现有技术中存在的问题，本申请提出了一种适用于任意角度旋转标注的...

【技术保护点】

1.一种适用于任意角度旋转标注的图像增广方法，其特征在于，该方法包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，在步骤1中，读取原始标签中目标框的位置信息，若原始图像为RGB三通道则需要对子图进行灰度化；根据旋转角度θ计算旋转矩阵Mθ，并对原始图像进行旋转得到旋转后的图像。

3.根据权利要求1所述的方法，其特征在于，在步骤4中，若提取到多个连通域，只保留像素面积大于等于M的连通域，M为连通域筛选最小面积。

4.根据权利要求1所述的方法，其特征在于，在步骤5中，将连通域内所有像素坐标(x,y)映射到原始图像上，采用如下公式：

5.根...

【技术特征摘要】

1.一种适用于任意角度旋转标注的图像增广方法，其特征在于，该方法包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，在步骤1中，读取原始标签中目标框的位置信息，若原始图像为rgb三通道则需要对子图进行灰度化；根据旋转角度θ计算旋转矩阵mθ，并对原始图像进行旋转得到旋转后的图像。

3.根据权利要求1所述的方法，其特征在于，在步骤4中，若提取到多个连通域，只保留像素面积大于等于m的连通域，m为连通域筛选最小面积。

4.根据权利要求1所述的方法，其特征在于，在步骤5中，将连通域内所有像素坐标(x,y)映射到原始图像上，采用如下公式：

5.根据权利要求3所述的方法，其特征在于，m的选择取决于目标在分割过程中被切分的最小区域所占的像素数目n，即m＝n-ξ(0≤ξ≤n)。

6.根据权利要求2所述的方法，其特征在于，所述...

【专利技术属性】
技术研发人员：李海鹏，靳松直，张伯川，陈开伟，邵学辉，刘严羊硕，曹来田，贾玉姣，郑文娟，丛龙剑，韦海萍，龚任杰，叶茂，
申请(专利权)人：北京航天自动控制研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人