基于卷积编码的运动目标检测方法及系统技术方案

技术编号:31907396 阅读:13 留言:0更新日期:2022-01-15 12:46
本发明专利技术公开了一种基于卷积编码的运动目标检测方法和系统,方法包括如下步骤:步骤1:采集待检测的彩色视频,所述的待检测的彩色视频包括M帧图像,M为正整数;步骤2:建立三通道卷积编码模板;步骤3:将待检测的彩色视频逐帧输入步骤2得到的三通道卷积编码模型进行编码,逐帧输出每帧图像的编码结果,根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域。本发明专利技术减少了计算量,提高了对于运动目标的检测速度,缩减了硬件成本。此外,与现有方法相比,本发明专利技术很大程度上消除了阴影对于运动目标检测的干扰,提高了运动目标检测的精度。精度。精度。

【技术实现步骤摘要】
基于卷积编码的运动目标检测方法及系统


[0001]本专利技术属于计算机视觉
,具体涉及一种基于卷积编码的运动目标检测方法及系统。

技术介绍

[0002]运动目标检测问题一直是计算机视觉领域的一个重点,应用场景也十分广泛,在安防告警、家庭监控、道路交通、行车导航、视频会议等诸多场景都有所应用。
[0003]国内外科学家们提出了许多运动目标检测的算法,Wren等提出了采用单高斯模型描述背景,该模型适用于静态稳定的背景,难以胜任复杂环境下的目标检测任务。为解决单高斯模型难以描述复杂背景的问题。Stauffer等提出使用混合高斯模型GMM(gaussian mixture model)拟合背景,实现了复杂背景下的目标检测,但在遇到简单背景时,会错误学习前景的灰度导致目标丢失且训练复杂度高阈值选取困难。除上述参数模型外还有无参模型,如码本模型为每个像素建立多个码字,并计算各个码字的上下界,能有效针对不同场景实现分割,但该算法一旦在建立过程中出现前景,则会导致码字错误,直到下次更新码字前都会一直导致误检,且无法适应较剧烈的环境变化。Barnich提出了无参模型Vibe,能够快速建模,并利用邻域像素采取随机策略更新背景,能有效适应各类环境,但对更新速率要求严格,太快会将目标吸收产生空洞,反之则易产生鬼影无法适应环境变化,且Vibe使用固定阈值灰度视频下召回率较低。闵卫东等提出了改进的Vibe模型,对鬼影问题进行了优化,但仍无法解决慢速前景产生空洞的问题。同样使用无参模型的还有Elgammal提出的核密度估计法KDE(kernel density estimation),通过统计像素点的直方图得到背景的分布,并使用核密度函数估计每个点为背景的概率,相比高斯建模更能反映真实的分布,对复杂背景估计更加准确,缺点是仅能得到概率,判断阈值设置困难,且计算概率复杂度较高。
[0004]除了传统方法近年来深度学习在运动目标检测方面也有所应用。但是无论传统方法还是深度学习的方法都存在明显的缺点。例如,传统方法鲁棒性不够,当存在多种干扰的情况下检测效果差强人意。深度学习的方法虽然在鲁棒性上有较大的提升,但是数据集的制作与完善是一直存在的难题,尤其是在现实生活中存在各种各样的运动目标,数据集很难将这些目标都覆盖,此外深度学习的方法对于硬件要求过高限制了其大规模的应用。

技术实现思路

[0005]本专利技术的目的在于提供一种基于卷积编码的运动目标检测方法及系统,用以解决现有技术中运动目标检测方法的抗干扰能力弱、检测精度差、检测速度慢等一系列问题。
[0006]为了实现上述任务,本专利技术采用以下技术方案:
[0007]一种基于卷积编码的运动目标检测方法,包括如下步骤:
[0008]步骤1:采集待检测的彩色视频,所述的待检测的彩色视频包括M帧图像,M为正整数;
[0009]步骤2:建立三通道卷积编码模板,所述的三通道卷积编码模板的尺寸为N
×
N/2
×
3且N∈[6,8,10],所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2
×
N/2
×
3,所述的左子模板内每个像素点的三通道的权重均为负,所述的右子模板内每个像素点的三通道的权重均为正,所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为
[0010]步骤3:将待检测的彩色视频逐帧输入步骤2得到的三通道卷积编码模型进行编码,逐帧输出每帧图像的编码结果,根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域;
[0011]其中,对于第m帧,m∈[1,M],第m帧图像的编码结果为第m

1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列,m=1时,第1帧图像的编码结果为第1帧图像编码得到的数字序列,根据第m帧编码结果进行筛选时,筛选出第m帧图像的编码结果中小于阈值的值,并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。
[0012]进一步的,步骤2中每个像素点的三通道的权重的取值包括均值方案或比例分配方案,其中均值方案为每个像素点的三通道的权重均为比例分配方案为根据每个像素点三通道中各通道值的比例分配每个像素点的三通道的权重。
[0013]进一步的,步骤2中,N=6。
[0014]进一步的,步骤4中,阈值的取值为5

10。
[0015]一种基于卷积编码的运动目标检测系统,包括数据采集模块、三通道卷积编码模板和输出模块;
[0016]所述的数据采集模块用于采集待检测的彩色视频,所述的待检测的彩色视频包括M帧图像,M为正整数;
[0017]所述的三通道卷积编码模板的尺寸为N
×
N/2
×
3且N∈[6,8,10],所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2
×
N/2
×
3,所述的左子模板内每个像素点的三通道的权重均为负,所述的右子模板内每个像素点的三通道的权重均为正,所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为
[0018]所述输出模块用于将待检测的彩色视频逐帧三通道卷积编码模型进行编码,逐帧输出每帧图像的编码结果,根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域;
[0019]其中,对于第m帧,m∈[1,M],第m帧图像的编码结果为第m

1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列,根据第m帧编码结果进行筛选时,筛选出第m帧图像的编码结果中小于阈值的值,并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。
[0020]进一步的,所述基于卷积编码的运动目标检测系统可设置在摄像头本地的数据存储及处理的单元内。
[0021]本专利技术与现有技术相比具有以下技术特点:
[0022](1)本专利技术设计了一种简单高效的编码模板将背景模型简化为数字序列,减少了
计算量,提高了对于运动目标的检测速度,缩减了硬件成本。
[0023](2)本专利技术很大程度上消除了阴影对于运动目标检测的干扰,提高了运动目标检测的精度。
[0024](3)目前的主流算法大多是建立复杂的数学模型例如GMM、KNN等。而本方法利用了图像编码的思想使用卷积模板将每一帧图像简化为数字序列,而且帧间差分运算也是在数字序列之间展开,极大的节约了计算开支。
[0025](3)本专利技术并未使用目标识别,而是利用了帧间信息找到了运动的目标并没有对运动目标分类。在运动目标检测领域深度学习一直都有明显的不足,首先运动目标的种类不定,现实中任何物体都有可能发生运动,也即都有可能是运动物体,如果要用深度学习解决运动目标检测问题需要准备大规模多种类的数据集然而这是不太可能的,其次深度学习的方法对算力要求高也就意味着部署成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积编码的运动目标检测方法,其特征在于,包括如下步骤:步骤1:采集待检测的彩色视频,所述的待检测的彩色视频包括M帧图像,M为正整数;步骤2:建立三通道卷积编码模板,所述的三通道卷积编码模板的尺寸为N
×
N/2
×
3且N∈[6,8,10],所述的三通道卷积编码模板包括左右两个子模板所述子模板的尺寸为N/2
×
N/2
×
3,所述的左子模板内每个像素点的三通道的权重均为负,所述的右子模板内每个像素点的三通道的权重均为正,所述的左右两个子模板内每个像素点的三通道的权重之和的绝对值为步骤3:将待检测的彩色视频逐帧输入步骤2得到的三通道卷积编码模型进行编码,逐帧输出每帧图像的编码结果,根据每帧的编码结果进行逐帧筛选并标记出每帧的运动目标存在区域;其中,对于第m帧,m∈[1,M],第m帧图像的编码结果为第m

1帧图像编码得到的数字序列和第m帧图像编码得到的数字序列做差后得到的数字序列,m=1时,第1帧图像的编码结果为第1帧图像编码得到的数字序列,根据第m帧编码结果进行筛选时,筛选出第m帧图像的编码结果中小于阈值的值,并将第m帧图像的编码结果中小于阈值的值对应的卷积区域标记为第m+1帧的运动目标存在区域。2.如权利要求1所述的基于卷积编码的运动目标检测方法,其特征在于,步骤2中每个像素点的三通道的权重的取值包括均值方案或比例分配方案,其中均值方案为每个像素点的三通道的权重均为比例分配方案为根据每个像素点三通道中各通道值的比例分配每个像素点的三通道的权重。3.如权利要求1所述的基于卷积编码的...

【专利技术属性】
技术研发人员:周祚峰吴清泉刘才钰
申请(专利权)人:西安西光产业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1