一种适用于智能视频监控的目标检测方法与系统技术方案

技术编号:26971513 阅读:32 留言:0更新日期:2021-01-06 00:02
本发明专利技术提供了一种适用于智能视频监控的目标检测方法,包括以下步骤:1)通过轻量级骨干网络模块提取图像特征,同时利用大卷积核深度卷积和小卷积核深度卷积以分别捕获高分辨率模式和低分辨率模式;2)通过注意力机制模块进一步提升特征提取力,同时利用通道注意力模块和空间注意力模块在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调或抑制信息,从而提高网络的表达力;3)通过多尺度预测模块预测目标的类别和位置,同时利用多尺度信息以适用于不同大小目标的检测。本发明专利技术还提供了一种适用于智能视频监控的目标检测系统。本发明专利技术的有益效果是:具有计算开销小且检测精度高的特点,可以实时检测视频流。

【技术实现步骤摘要】
一种适用于智能视频监控的目标检测方法与系统
本专利技术涉及目标检测方法,尤其涉及一种适用于智能视频监控的目标检测方法与系统。
技术介绍
随着人工智能技术水平的不断提升以及云计算、大数据、物联网等相关产业的协同发展,智能视频监控逐渐普及。目标检测方法可以广泛应用在智能视频监控的诸多应用场景,如智能安防、智能交通、智能工厂等。广泛的应用意味着巨大的需求,也意味着巨大的计算开销和运维成本。但是,当前基于深度学习的目标检测方法面临精度高但开销大或开销小但精度低的问题,故不适用于智能视频监控。因此,计算开销小且检测精度高的目标检测方法非常重要。目前,基于深度学习的目标检测方法可分为基于候选区域的两阶段网络和基于回归的单阶段网络。两阶段网络首先生成一系列的候选区域,然后判别其类别并对候选区域的位置进行回归修正。此类方法精度高,但生成候选区域的子网计算开销很大。基于回归的单阶段网络直接从图像上预测边界框位置和所属类别概率。相较于两阶段网络,此类方法没有生成候选区域阶段,因此开销小,但也导致精度低。因此,如何提供一种开销小且精度高的目标检测方法,是本领域技术人员所亟待解决的技术问题。
技术实现思路
为了解决现有技术中的问题,本专利技术提供了一种适用于智能视频监控的目标检测方法与系统,具有精度高且开销小的特点,可以实时检测视频流。本专利技术提供了一种适用于智能视频监控的目标检测方法,包括以下步骤:1)通过轻量级骨干网络模块提取图像特征,同时利用大卷积核深度卷积和小卷积核深度卷积以分别捕获高分辨率模式和低分辨率模式,从而在计算开销小的前提下获得良好的特征提取能力;2)通过注意力机制模块进一步提升特征提取力,同时利用通道注意力模块和空间注意力模块在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调或抑制信息,从而提高网络的表达力;3)通过多尺度预测模块预测目标的类别和位置,同时利用多尺度信息以适用于不同大小目标的检测。作为本专利技术的进一步改进,所述的轻量级骨干网络模块主要由1×1卷积、批标准化、激活函数和混合深度卷积所构成的第一基本模块堆叠而成。作为本专利技术的进一步改进,所述的轻量级骨干网络模块提取特征的方式如下:输入:X∈RH×W×3为固定尺寸的训练/测试RGB图像,H表示图像的高,W表示图像的宽;输出:F∈RH×W×C为轻量级骨干网络提取的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;步骤a1)通过1×1卷积将低维特征映射到高维,批标准化层保证神经网络每一层的输入保持相同分布,通过ReLU激活函数增加神经网络各层之间的非线性关系;步骤b1)通过混合深度卷积同时捕获高分辨率模式和低分辨率模式和降低计算复杂度,批标准化层保证神经网络每一层的输入保持相同分布,ReLU/Swish激活函数增加神经网络各层之间的非线性关系;步骤c1)1×1卷积将高维特征映射到低维,批标准化层保证神经网络每一层的输入保持相同分布;步骤d1)重复上述步骤a1)、b1)、c1)5次,每重复上述步骤a1)、b1)、c1)一次,则形成所述轻量级骨干网络模块提取特征的一个阶段,即共形成轻量级骨干网络模块提取特征的5个阶段。作为本专利技术的进一步改进,所述的注意力机制模块包含两个子模块,分别为通道注意力模块和空间注意力模块,两个子模块分别在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调重要信息和抑制非重要信息。作为本专利技术的进一步改进,所述的注意力机制模块的建立方法如下:输入:F∈RH×W×C为所述的轻量级骨干网络模块提取特征的每一阶段输出的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;输出:F″∈RH×W×C为注意力机制模块调整后的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;步骤a2)通道注意力模块通过平均池化和最大池化操作来聚合输入特征图的空间信息,然后将其馈入具有一个隐藏层的多层感知机,再使用逐元素求和来合并输出的特征向量,产生通道注意力图MC∈R1×1×C;步骤b2)将步骤a2)输出的通道注意力图MC∈R1×1×C沿通道轴进行平均池化和最大池化操作,然后进行张量拼接并馈入7×7卷积,产生二维空间注意力图MS∈RH×W×C;步骤c2)在权利要求3所述的轻量级骨干网络模块提取特征的每一阶段后依次执行上述步骤a2)和b2),即每重复步骤a2)、b2)一次,则形成注意力机制模块调整特征图的一个阶段,依次为注意力机制模块调整特征图的第一阶段、注意力机制模块调整特征图的第二阶段、注意力机制模块调整特征图的第三阶段、注意力机制模块调整特征图的第四阶段、注意力机制模块调整特征图的第五阶段。作为本专利技术的进一步改进,所述的多尺度预测模块首先堆叠由卷积、批标准化层和LeakyReLU激活函数构成的第二基本模块,然后通过1×1卷积输出初步检测结果,最后使用非极大值抑制合并初步结果以输出最终结果。作为本专利技术的进一步改进,多尺度预测模块的建立方法如下:输入:F″∈RH×W×C为注意力机制模块调整特征图的第三阶段、注意力机制模块调整特征图的第四阶段、注意力机制模块调整特征图的第五阶段调整后的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;输出:B表示边界框坐标,P表示边界框置信度,C表示边界框所属类别;步骤a3)在注意力机制模块调整特征图的第五阶段调整后,执行由卷积、批标准化层和LeakyReLU激活函数构成的第二基本模块6次,通过1×1卷积输出大尺度目标的初步检测结果;步骤b3)将步骤a3)中第5次执行第二基本模块输出的特征图输入到第二基本模块并上采样2倍,然后与注意力机制模块调整特征图的第四阶段输出的特征图拼接,再执行第二基本模块6次,通过1×1卷积输出中尺度目标的初步检测结果;步骤c3)将步骤b3)中拼接后的第5次第二基本模块输出的特征图输入到第二基本模块并上采样2倍,然后与注意力机制模块调整特征图的第三阶段输出的特征图拼接,再执行第二基本模块6次,通过1×1卷积输出小尺度目标的初步检测结果;步骤d3)将步骤a3)、步骤b3)和步骤c3)的初步检测结果进行非极大值抑制,输出最终的检测结果。本专利技术还提供了一种适用于智能视频监控的目标检测系统,包括可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如上述中任一项所述的方法。本专利技术的有益效果是:具有计算开销小且检测精度高的特点,可以实时检测视频流。附图说明图1是本专利技术一种适用于智能视频监控的目标检测方法的流程图。具体实施方式下面结合附图说明及具体实施方式对本专利技术作进一步说明。如图1所示,一种适用于智能视频监控的目标检测方法,包含三个模块:轻量级骨干网络模块、注意力机制模块和多尺度预测模块,具体步骤如下:1)通过轻量级骨干网络模块提取图像特征,同时利用大卷积本文档来自技高网...

【技术保护点】
1.一种适用于智能视频监控的目标检测方法,其特征在于,包括以下步骤:/n1)通过轻量级骨干网络模块提取图像特征,同时利用大卷积核深度卷积和小卷积核深度卷积以分别捕获高分辨率模式和低分辨率模式,从而在计算开销小的前提下获得良好的特征提取能力;/n2)通过注意力机制模块进一步提升特征提取力,同时利用通道注意力模块和空间注意力模块在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调或抑制信息,从而提高网络的表达力;/n3)通过多尺度预测模块预测目标的类别和位置,同时利用多尺度信息以适用于不同大小目标的检测。/n

【技术特征摘要】
1.一种适用于智能视频监控的目标检测方法,其特征在于,包括以下步骤:
1)通过轻量级骨干网络模块提取图像特征,同时利用大卷积核深度卷积和小卷积核深度卷积以分别捕获高分辨率模式和低分辨率模式,从而在计算开销小的前提下获得良好的特征提取能力;
2)通过注意力机制模块进一步提升特征提取力,同时利用通道注意力模块和空间注意力模块在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调或抑制信息,从而提高网络的表达力;
3)通过多尺度预测模块预测目标的类别和位置,同时利用多尺度信息以适用于不同大小目标的检测。


2.根据权利要求1所述的适用于智能视频监控的目标检测方法,其特征在于:所述的轻量级骨干网络模块主要由1×1卷积、批标准化、激活函数和混合深度卷积所构成的第一基本模块堆叠而成。


3.根据权利要求2所述的适用于智能视频监控的目标检测方法,其特征在于:所述的轻量级骨干网络模块提取特征的方式如下:
输入:X∈RH×W×3为固定尺寸的训练/测试RGB图像,H表示图像的高,W表示图像的宽;
输出:F∈RH×W×C为轻量级骨干网络提取的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;
步骤a1)通过1×1卷积将低维特征映射到高维,批标准化层保证神经网络每一层的输入保持相同分布,通过ReLU激活函数增加神经网络各层之间的非线性关系;
步骤b1)通过混合深度卷积同时捕获高分辨率模式和低分辨率模式和降低计算复杂度,批标准化层保证神经网络每一层的输入保持相同分布,ReLU/Swish激活函数增加神经网络各层之间的非线性关系;
步骤c1)1×1卷积将高维特征映射到低维,批标准化层保证神经网络每一层的输入保持相同分布;
步骤d1)重复上述步骤a1)、b1)、c1)5次,每重复上述步骤a1)、b1)、c1)一次,则形成所述轻量级骨干网络模块提取特征的一个阶段,即共形成轻量级骨干网络模块提取特征的5个阶段。


4.根据权利要求3所述的适用于智能视频监控的目标检测方法,其特征在于:所述的注意力机制模块包含两个子模块,分别为通道注意力模块和空间注意力模块,两个子模块分别在通道和空间轴两个维度上对特征图进行加权,调整特征响应值以强调重要信息和抑制非重要信息。


5.根据权利要求4所述的适用于智能视频监控的目标检测方法,其特征在于:所述的注意力机制模块的建立方法如下:
输入:F∈RH×W×C为所述的轻量级骨干网络模块提取特征的每一阶段输出的特征图,H表示特征图的高,W表示特征图的宽,C表示特征图的数量;
输出:F″∈RH×W×C为注意力机制模块调整后的特征图,H表示特征图的高,W表示特征图的宽,C表...

【专利技术属性】
技术研发人员:徐勇吴志昊
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1