视频中的暴力内容检测方法、装置及设备制造方法及图纸

技术编号:26971603 阅读:33 留言:0更新日期:2021-01-06 00:02
本申请属于图像处理领域,提供了一种视频的暴力内容检测方法、装置及设备。该方法包括:获取待检测视频;对所述待检测视频进行人像检测,提取待检测视频的帧画面中的人像所在区域的图像;根据所提取的人像所在区域的图像,确定待检测视频中的人像所对应的光流;将所述人像所在区域的图像和所述光流输入到已训练的暴力检测模型中处理,输出暴力内容的检测结果。由于本申请仅需对待检测视频中的人像区域进行处理,通过暴力检测模型对人像区域和人像对应的光流进行计算,有利于减少冗余信息干扰,有利于提升对视频的暴力内容的检测精度。

【技术实现步骤摘要】
视频中的暴力内容检测方法、装置及设备
本申请属于图像处理领域,尤其涉及视频中的暴力内容检测方法、装置及设备。
技术介绍
随着视频监控系统的大量部署,获取到的视频数据也越来越多。为了能够及时的发现所监控的内容中存在的异常内容,比如及时的发现视频中的暴力内容,以便于及时的采取应对措施,减小异常事故所带来的损失。在对视频内容进行实时监控的方式中,传统的人工监控不能有效的满足对大量的视频监控内容的检测要求。为了减少内容监控的人工成本,可以采用深度网络模型来提取图像的全局特征,基于全局特征确定暴力内容的检测结果。然而,在视频监控等场景中,往往会包括较多的冗余信息,使得深度网络模型进行暴力内容检测的结果的精度不高。
技术实现思路
有鉴于此,本申请实施例提供了一种视频中的暴力内容检测方法、装置及设备,以解决现有技术中通过深度网络模型进行暴力内容检测的结果的精度不高的问题。本申请实施例的第一方面提供了一种视频中的暴力内容检测方法,所述方法包括:获取待检测视频;对所述待检测视频进行人像检测,提取待检测视频的帧画面中的人本文档来自技高网...

【技术保护点】
1.一种视频中的暴力内容检测方法,其特征在于,所述方法包括:/n获取待检测视频;/n对所述待检测视频进行人像检测,提取待检测视频的帧画面中的人像所在区域的图像;/n根据所提取的人像所在区域的图像,确定待检测视频中的人像所对应的光流;/n将所述人像所在区域的图像和所述光流输入到已训练的暴力检测模型中处理,输出暴力内容的检测结果。/n

【技术特征摘要】
1.一种视频中的暴力内容检测方法,其特征在于,所述方法包括:
获取待检测视频;
对所述待检测视频进行人像检测,提取待检测视频的帧画面中的人像所在区域的图像;
根据所提取的人像所在区域的图像,确定待检测视频中的人像所对应的光流;
将所述人像所在区域的图像和所述光流输入到已训练的暴力检测模型中处理,输出暴力内容的检测结果。


2.根据权利要求1所述的方法,其特征在于,将所述人像所在区域的图像和所述光流输入到已训练的暴力检测模型中处理,输出暴力内容的检测结果,包括:
将所述人像所在区域的图像输入已训练的暴力检测模型中的第一时空卷积层进行时空卷积,获得第一特征信息;
将所述光流输入已训练的暴力检测模型中的第二时空卷积层进行时空卷积,获得第二特征信息;
激活所述第一特征信息和所述第二特征信息,然后依次经过池化层、融合层和全连接层处理,输出暴力内容的检测结果;
其中,第一时空卷积层和第二时空卷积层包括局部卷积层和非局部卷积层。


3.根据权利要求2所述的方法,其特征在于,所述非局部卷积层的卷积操作表示为:



其中,xi表示第i个卷积块的输入,zi表示第i个卷积块的输出,Wv1和Wv2表示线性变换矩阵,Wv2ReLU(LN(Wv1)表示残差卷积中的瓶颈设计,Np=H·W·T表示参数量,H表示图像长度,W表示图像宽度,T表示图像深度,表示全局注意力的权重,这其中Wk表示线性变换矩阵,xj表示遍历全局时第j个卷积块的输入,xm表示遍历全局时第m个卷积块的输入。


4.根据权利要求2所述的方法,其特征在于,所述局部卷积层的卷积操作表示为:
(I+T·S)·xi:=xi+T(S(xi))=zi
其中,其中xi表示第i个卷积块的输入,zi表示第i个卷积块的输入和输出,T代表n*1*1的时间卷积,S表示1*n*n的空间卷积,n为时间卷积核或空间卷积核的尺寸参数,I表示单位矩阵。


5.根据权利要求2所述的方法,其特征在于,激活所述第一特征信息和第二特征信息,包括:
通过Relu函数激活第一特征信息;
通过sigmoid函数激活第二特征信息。


6...

【专利技术属性】
技术研发人员:乔宇
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1