基于差分卷积神经网络的运动目标检测方法技术

技术编号:28786617 阅读:25 留言:0更新日期:2021-06-09 11:21
本发明专利技术提供了一种基于差分卷积神经网络的运动目标检测方法,通过构建卷积神经网络对运动目标进行检测,其优点是将视频的当前帧与对应的背景帧进行差分,得到差分图像,将差分图像作为模型的输入,模型的输入不包含场景信息,如背景。该卷积神经网络只是学习场景的变化,其中没有关于场景的具体信息,因此该卷积神经网络具有较强的泛化能力,只需要训练一次,就可以检测出同一类型的视频,大大扩展卷积神经网络模型的使用范围,具有良好的应用前景。经测试,现有的基于深度学习的运动目标检测模型在测试与训练视频无关的视频时,F

【技术实现步骤摘要】
基于差分卷积神经网络的运动目标检测方法


[0001]本专利技术属于视频监控
,具体涉及一种基于差分卷积神经网络的运动目标检测方法。

技术介绍

[0002]近些年来,视频得到了广泛的应用。然而,目前的视频监控只是一个简单的记录。近年来,智能视频监控逐渐成为安全领域的核心技术之一。运动目标检测是智能视频监控的重要基础,对目标的建模、跟踪和识别有着重要的影响。
[0003]动态背景下的运动目标检测仍然是一项具有挑战性的任务。在学者们的不断努力下,提出了许多方法。这些方法可以分为以下几种:深度学习方法、基于像素的方法和子空间学习方法。这些方法取得了令人满意的实际效果,尤其是深度学习方法。然而,这些深度学习方法存在很大的缺陷,即泛化能力差。它们只能处理与培训数据相关的数据。在特定场景中,不可能为每个摄影机收集注释数据来训练模型。因此需要一种方法来提高深度学习在运动目标检测中的泛化能力。

技术实现思路

[0004]本专利技术的目的在于提供一种基于差分卷积神经网络的运动目标检测方法,能够极大地提高深度学习在运动目标检测中的泛化能力。
[0005]为达到上述目的,本专利技术采用的技术方案为:本专利技术提供一种基于差分卷积神经网络的运动目标检测方法,包括训练部分和测试部分,所述训练部分包括以下步骤:1.1)数据初始化将所选择的视频的分辨率调整为240
×
320;标注调整分辨率后的视频中的运动目标,得到视频中每一帧的GroundTruth,记为I
G
;对调整分辨率后的视频进行中值滤波处理,得到背景帧,记为I
B
;将视频的当前帧I
C
与对应的背景帧I
B
进行差分,得到当前帧的差分图像,记为I
Input
;1.2)构建卷积神经网络:所述卷积神经网络包含输入层、隐含层和输出层:所述输入层包括一个分辨率为240
×
320、通道数为3的立体图像,其中立体图像为I
Input
;卷积神经网络中的卷积尺寸大小为3
×
3;所述隐含层中第1层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用8个卷积来生成8个特征图;所述隐含层中第2层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用8个卷积来生成8个特征图;
所述隐含层中第3层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用32个卷积来生成32个特征图;所述隐含层中第4层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用64个卷积来生成64个特征图;所述隐含层中第5层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用64个卷积来生成64个特征图;所述隐含层中第6层采用卷积、批归一化、激活层和池化层Conv+BN+Relu,使用128个卷积来生成128个特征图;所述隐含层中第7层采用卷积、批归一化、激活层和池化层DeConv+BN+Relu,使用64个卷积来生成64个特征图;所述隐含层中第8层采用卷积、批归一化、激活层和池化层DeConv+BN+Relu,使用32个卷积来生成32个特征图;所述隐含层中第9层采用卷积、批归一化、激活层和池化层DeConv+BN+Relu,使用8个卷积来生成8个特征图;所述隐含层中第10层采用卷积、批归一化、激活层和池化层DeConv+BN+ClippedRelu,使用1个卷积来生成1个特征图;所述输出层中包含了回归层;1.3)设置卷积神经网络采用Adam对卷积神经网络进行参数更新;参数更新过程中的均方误差为卷积神经网络的损失函数;1.4)训练卷积神经网络对步骤1.2)设定的卷积神经网络进行训练,得到卷积神经网络模型;所述测试部分包括以下步骤:2.1)得到卷积神经网络模型输入将步骤1.1)得到的I
Input
作为卷积神经网络模型的输入,对应的I
G
作为卷积神经网络模型的输出,I
Input

I
G
;2.2)得到运动目标的检测结果将步骤2.1)得到的卷积神经网络模型的输入放入卷积神经网络模型中进行计算,即得到运动目标的检测结果。
[0006]所述步骤1.1)中的中值滤波处理步骤如下:给定视频中的一个像素v,它的时间上的邻域像素为N
v
={v
i

n
,

,v
i
,

,I
i+n
},其中n为正整数,代表着窗口的大小,n取30,计算N
v
的中值,得到像素v的背景像素;依次类推,对视频中的所有像素进行中值滤波,得到所有像素的背景像素,形成背景帧I
B

[0007]相对于现有技术,本专利技术的有益效果为:本专利技术提供的基于差分卷积神经网络的运动目标检测方法,通过构建卷积神经网络对运动目标进行检测,其优点是将视频的当前帧与对应的背景帧进行差分,得到差分图像,将差分图像作为模型的输入,模型的输入不包含场景信息,如背景帧。本专利技术中构建的卷积神经网络只是学习场景的变化,所以在该卷积神经网络中没有关于场景的具体信息,因此该卷积神经网络具有较强的泛化能力。本专利技术构建的卷积神经网络只需要训练一次,
就可以检测出同一类型的视频,这可以大大扩展卷积神经网络模型的使用范围,极大地提高深度学习在运动目标检测中的泛化能力,具有良好的应用前景。经测试,现有的基于深度学习的运动目标检测模型在测试与训练视频无关的视频时,F

measure值为0.2至0.3之间,而本专利技术提供的基于差分卷积神经网络的运动目标检测方法在测试与训练视频无关的视频时,F

measure值为0.73。
具体实施方式
[0008]下面进一步阐述本专利技术,以下实例仅用于描述本专利技术而不用于限制本专利技术的使用范围,各领域工程技术人员对本专利技术的各种等价变换均包含在本专利技术所要求的权力范围内。
[0009]本专利技术提供的基于差分卷积神经网络的运动目标检测方法,包括训练部分和测试部分两个过程:所述的训练部分如下:步骤:1_1数据初始化:选择一些视频进行分辨率调整,调整为240
×
320;标注调整后的视频中的运动目标,得到视频中每一帧的GroundTruth,记为I
G
;使用中值滤波对视频进行处理得到背景帧,记为I
B
;中值滤波步骤如下:给定视频中的一个像素v,它的时间上的邻域像素为N
v
={v
i

n
,

,v
i
,

,I
i+n
},其中n为正整数,代表着窗口的大小,n取30,计算N
v
的中值,得到背景像素。对视频中的所有像素进行中值滤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于差分卷积神经网络的运动目标检测方法,其特征在于:包括训练部分和测试部分,所述训练部分包括以下步骤:1.1)数据初始化将所选择的视频的分辨率调整为240
×
320;标注调整分辨率后的视频中的运动目标,得到视频中每一帧的GroundTruth,记为I
G
;对调整分辨率后的视频进行中值滤波处理,得到背景帧,记为I
B
;将视频的当前帧I
C
与对应的背景帧I
B
进行差分,得到当前帧的差分图像,记为I
Input
;1.2)构建卷积神经网络:所述卷积神经网络包含输入层、隐含层和输出层:所述输入层包括一个分辨率为240
×
320、通道数为3的立体图像,其中立体图像为I
Input
;卷积神经网络中的卷积尺寸大小为3
×
3;所述隐含层中第1层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用8个卷积来生成8个特征图;所述隐含层中第2层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用8个卷积来生成8个特征图;所述隐含层中第3层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用32个卷积来生成32个特征图;所述隐含层中第4层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用64个卷积来生成64个特征图;所述隐含层中第5层采用卷积、批归一化、激活层和池化层Conv+BN+Relu+Maxpool,使用64个卷积来生成64个特征图;所述隐含层中第6层采用卷积、批归一化、激活层和池化层Conv+BN+Relu,使用128个卷积来生成128个特征图;所述隐含层中第7层采用卷积、批归一化、激活层和池化层DeConv+BN+Relu,使用6...

【专利技术属性】
技术研发人员:李阳朱爱玺
申请(专利权)人:江苏信息职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1