一种高分辨率图片识别小目标的方法技术

技术编号:29938520 阅读:27 留言:0更新日期:2021-09-04 19:19
本发明专利技术公开了一种高分辨率图片识别小目标的方法,步骤包括:设置高分辨率图片中目标的最大尺寸;将输入的第一图片缩放为预定大小尺寸的第二图片;以第二图片左上角为坐标原点,从左到右对图片进行分割;从上到下重复上述图片分割步骤,直到整个输入图片分割完毕;对每一张子图片分别通过神经网络做识别,得到有效目标的信息;去除子图片中不完整的目标;将所有子图片重新拼接为第二图片大小的图片;将拼接后的图片中重复目标去除;将去除重复目标后的图片进行缩放,输出第一图片大小的图片。本发明专利技术使用大分辨率识别方法,在小目标的识别上,不但能够识别到更多的目标,而且目标置信度普遍高于小分辨率的识别方法。置信度普遍高于小分辨率的识别方法。置信度普遍高于小分辨率的识别方法。

【技术实现步骤摘要】
一种高分辨率图片识别小目标的方法


[0001]本专利技术属于目标识别领域,尤其涉及一种高分辨率图片识别小目标的方法。

技术介绍

[0002]当前大部分的目标识别系统的神经网络都是输入较低分辨率的图片,譬如Yolo的常用分辨率是416
×
416,ssd的常用分辨率是320
×
240。这样的分辨率在目标尺寸较大的情况下没有任何问题,而且较小的分辨率可以有效降低计算量,但在一张远距离拍摄的1920
×
1080的分辨率的图片中,一辆汽车在图片里的像素尺寸假设为50
×
50,如果缩放到416
×
416,汽车的像素尺寸变成了10
×
20,这样目标就很难被识别到或者识别正确。如果识别的目标里有人员识别,这种缩放之下根本不可能被识别到。
[0003]针对大图片的识别,最简单的方式就是神经网络直接使用高分辨率的输入,但实际上受限于硬件性能,GPU对高分辨率图片的处理存在很大的限制,我们无法无限制的提升神经网络的输入分辨率。

技术实现思路

[0004]有鉴于此,本专利技术采用了大分辨率图片直接识别的方式,虽然需要的计算量增大很多,但效果提升更大,尤其是无人机高空拍摄的场景中,普通的识别方案根本不可行,而本专利技术却行之有效。
[0005]具体地,本专利技术提出了一种高分辨率图片识别小目标的方法,方法包括以下步骤:
[0006]设置高分辨率图片中目标的最大尺寸M
×
M;/>[0007]将输入的第一图片缩放为预定大小尺寸的第二图片;
[0008]以所述第二图片左上角为坐标原点(0,0),从左到右对图片进行分割,分割的子图片大小为N
×
N;
[0009]从上到下重复上述图片分割步骤,直到整个输入图片分割完毕;
[0010]对每一张子图片分别通过神经网络做识别,得到有效目标的信息;
[0011]去除子图片中不完整的目标;
[0012]将所有子图片重新拼接为第二图片大小的图片;
[0013]将拼接后的图片中重复目标去除;
[0014]将去除重复目标后的图片进行缩放,输出第一图片大小的图片。
[0015]进一步地,如果每行子图片数量为n,每列子图片数量为m,每张子图片左上角坐标(i
×
(N

M),j
×
(N

M)),i为0~n

1,j为0~m

1。
[0016]进一步地,所述有效目标包括目标类别以及目标位置、大小。
[0017]进一步地,所述神经网络采用Yolo v3模型。
[0018]进一步地,所述去除子图片中不完整的目标的步骤如下:尽量保留上面裁切边和左边裁切边的不完整目标,去除右边裁切边和下面裁切边的不完整目标。
[0019]进一步地,所述去除子图片中不完整的目标的步骤如下:当目标的左下角坐标在
子图片冗余区内时,去除该目标,所述子图片冗余区为相邻子图片重叠的区域。
[0020]进一步地,所述将所有子图片重新拼接为第二图片大小的图片的方法为:按照每张子图片的左上角坐标进行拼接。
[0021]进一步地,将拼接后的图片中重复目标去除的方法为非极大值抑制算法。
[0022]相对于现有技术,本专利技术的有益效果如下:
[0023]在小目标的识别上,不但能够识别到更多的目标,而且目标置信度普遍高于小分辨率的识别方法。
附图说明
[0024]图1本专利技术的高分辨率图片识别小目标的方法流程图;
[0025]图2本专利技术的图片分割方法示意图;
[0026]图3本专利技术的去除不完整目标方法的示意图;
[0027]图4本专利技术的实验使用的高分辨率图片;
[0028]图5传统方法的小目标识别结果;
[0029]图6本专利技术的小目标识别结果。
具体实施方式
[0030]下面结合附图对本专利技术作进一步的说明,但不以任何方式对本专利技术加以限制,基于本专利技术教导所作的任何变换或替换,均属于本专利技术的保护范围。
[0031]如图1所示,本专利技术公开的一种高分辨率图片识别小目标的方法,包括以下步骤:
[0032]S1:设置高分辨率图片中目标的最大尺寸M
×
M;
[0033]示例性地,限定高分辨率图片中目标的最大尺寸为50
×
50,这个限定会在下文解释。神经网络系统采用Yolo v3模型,模型的输入图片尺寸为416
×
416。
[0034]实际使用中该方法适合任何模型,模型的输入尺寸理论上越大越好,当然,由于硬件限制,很多训练系统无法使用大尺寸。
[0035]S2:将输入的第一图片缩放为预定大小尺寸的第二图片;
[0036]示例性地,为了方便切割,将1920
×
1080图片缩放为1880
×
1148,实际该缩放对目标影响不大,否则需要在训练时做相应的处理,达到最好的效果。
[0037]S3:以所述第二图片左上角为坐标原点(0,0),从左到右对图片进行分割,分割的子图片大小为N
×
N;从上到下重复上述图片分割步骤,直到整个输入图片分割完毕;本实施例中N设为416,以便和Yolo神经网络处理的图片大小一致。
[0038]从左到右,从上到下对图片进行切割,为了防止目标被切断影响识别,我们采用以下方式来切割。
[0039]如果每行子图片数量为n,每列子图片数量为m,每张子图片左上角坐标(i
×
(N

M),j
×
(N

M)),i为0~n

1,j为0~m

1;
[0040]示例性地,输入的大图片如图2所示,把大图片左上角作为坐标(0,0)。
[0041]子图片1左上角坐标(0,0),子图片2左上角坐标(366,0),子图片3左上角坐标(732,0),子图片6左上角坐标为(0,366),以此类推,每张子图片和前一张子图片冗余50像素的数据,因为目标最大为50
×
50,就可以保证,目标在其中一张图片中肯定是完整的。切
割完成后我们得到3
×
5共15张子图片。
[0042]S4:对每一张子图片分别通过神经网络做识别,得到有效目标的信息;
[0043]我们对每一张图片通过神经网络做识别,得到有效目标的信息,其中有效目标包括目标类别以及目标位置、大小。本实施例选择Yolo V3神经网络模型进行目标识别,在其它实施例中还可以使用其它神经网络模型,本专利技术对此不做限制。
[0044]S5:如果子图片的裁切边存在被切开的目标,去除子图片中不完整的目标;
[0045]我们需要根据每张子图片的裁切本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种高分辨率图片识别小目标的方法,其特征在于,包括以下步骤:设置高分辨率图片中目标的最大尺寸M
×
M;将输入的第一图片缩放为预定大小尺寸的第二图片;以所述第二图片左上角为坐标原点(0,0),从左到右对图片进行分割,分割的子图片大小为N
×
N;从上到下重复上述图片分割步骤,直到整个输入图片分割完毕;对每一张子图片分别通过神经网络做识别,得到有效目标的信息;去除子图片中不完整的目标;将所有子图片重新拼接为第二图片大小的图片;将拼接后的图片中重复目标去除;将去除重复目标后的图片进行缩放,输出第一图片大小的图片。2.根据权利要求1所述的高分辨率图片识别小目标的方法,其特征在于,如果每行子图片数量为n,每列子图片数量为m,每张子图片左上角坐标(i
×
(N

M),j
×
(N

M)),i为0~n

1,j为0~m
‑<...

【专利技术属性】
技术研发人员:谷志军连启慧易明
申请(专利权)人:湖南博远翔电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1