一种图像数据增强方法、系统及装置制造方法及图纸

技术编号:38076430 阅读:27 留言:0更新日期:2023-07-06 08:44
本发明专利技术属于图像处理技术领域,具体涉及了一种图像数据增强方法、系统及装置,旨在解决密集预测任务中因目标图像边缘不清晰导致的误检漏检的问题。本发明专利技术的方法包括:获取第一目标图像,得到目标掩码P

【技术实现步骤摘要】
一种图像数据增强方法、系统及装置


[0001]本专利技术属于图像处理
,具体涉及了一种图像数据增强方法、系统及装置。

技术介绍

[0002]图像数据增强技术是提高模型精度增强泛化能力的有效方法。常用的增强方法有:翻转、旋转、裁剪、填充、缩放等。这些方法通过对现有数据进行几何变换的方式来达到扩充数据量的目的,能够提高模型的精度和泛化能力。
[0003]但以上方法,并未考虑目标区域与背景区域的边缘关系。在一些场景下目标区域和背景区域的边缘会变得模糊,使得目标图像的一部分与背景难以区分。这种情况下通常会造成目标边缘识别不清的问题,在某些密集预测任务中造成定位错误,甚至误检漏检等问题。另外,已有研究表明,目标图像的颜色会对识别结果的输出产生影响。例如,当目标图像与训练集中的图像颜色差距较大时,对目标图像的检测误差会变大。虽然可以通过对图像整体进行颜色变换进行一定程度的解决,但是整体变换也会带来与真实场景的不一致。基于此,本专利技术提出了一种图像数据增强方法。

技术实现思路

[0004]为了解决现有技术中的上述问题,即现有技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像数据增强方法,其特征在于,该方法包括:步骤S10,获取待增强的图像中的目标区域图像,作为第一目标图像;步骤S20,通过设定的数据增强方法对所述第一目标图像进行增强,进而得到增强后的图像:步骤S21,对所述第一目标图像进行图像分割处理,得到目标掩码P
mask
,基于所述P
mask
获取所述第一目标图像的左边缘的坐标值集合L和右边缘的坐标值集合R,并对所述L、所述R中的横坐标进行增加或减少处理,得到左边缘相邻的背景坐标集合L1和右边缘相邻的背景坐标集合R1;步骤S22,将所述L1和所述R1在所述第一目标图像中进行采样,得到左边缘像素集合P
l
和右边缘像素集合P
r
;步骤S23,根据所述P1和所述P
r
计算得出所述第一目标图像中的目标区域部分最小的X方向的坐标值X0、最小的Y方向的坐标值Y0,以及最大的X方向的坐标值X1、最大的Y方向的坐标值Y1,根据所述X0、所述Y0、所述X1、所述Y1,得到目标区域最小外接矩形框Box;将所述P
l
和所述P
r
填充到所述Box中,得到图像B
mask
,将所述P
mask
与所述图像B
mask
中对应的像素相乘,得到背景掩码G
mask
;步骤S24,将所述第一目标图像与所述G
mask
进行加权和处理,进而得到增强后的图像。2.根据权利要求1所述的一种图像数据增强方法,其特征在于,对所述L、所述R中的横坐标进行增加或减少处理,得到左边缘相邻的背景坐标集合L1、右边缘相邻的背景坐标集合R1,其方法为:将所述L中的所有横坐标值减少第一预设阈值,得到左边缘相邻的背景坐标集合L1,将所述R中的所有横坐标值增加第一预设阈值,得到右边缘相邻的背景坐标集合R1。3.根据权利要求1所述的一种图像数据增强方法,其特征在于,将所述第一目标图像与所述G
mask
进行加权和处理,其方法为:步骤S241,初始化限制目标区域的权值最小为w、第二预设阈值为R
dw
,目标区域的权值为P
w
,G
mask
的权值为G
w
,所述P
w
与G
w
的计算方法为:P
w
=(1

w)*R
dw
+w,G
w
=1

P
w
;其中,w为取值在0

1之间并能够调节的任意数字;步骤S242,根据第一随机数组L
rx
和L
ry
输出与左边界相邻的矩形区域Lregion,所述Lregion左上顶点坐标为(L
wminx
,L
wminy
)、右下顶点坐标为(L
wmaxx
,L
wmaxy
);获取用于限制所述Lregion占最小外接矩形框Box面积的最小比例的第二随机数组L
ax
与L
ay
,所述Lregion的左上顶点和右下顶点的坐标值的计算方法为:L
wminx
=x0,L
wminy
=y0;L
wmaxx
=min(L
wminx
+(L
rx
*(1

L
ax
)+L
ax
)*(x1‑
x0),x1);L
wmaxy
=min(L
wminy
+(L
ry
*(1

L
ay
)+L
ay
)*(y1‑
y0),y1);其中,min为取两个数值中最小值的函数;步骤S243,根据第三随机数组R
rx
和R
ry
输出与右边界相邻的矩形区域Rregion,所述Rregion左上顶点坐标为(R
wminx
,R
wminy
)、右下顶点坐标为(R
wmaxx
,R
wmaxy
),获取用于限制所述Lregion占最小外接矩形框Box面积的最小比例的第四随机数组R
ax
与R
ay
,所述Rregion的左上顶点和右下顶点的坐标值的计算方法为:
R
wmaxx
=x1,R
wmaxy
=y1;R
...

【专利技术属性】
技术研发人员:赵晓陈张引李尧
申请(专利权)人:北京睛采智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1