【技术实现步骤摘要】
基于视听学习的人群异常事件检测方法
[0001]本专利技术属计算机视觉、智能视频分析
,具体涉及一种基于视听学习的人群异常事件检测方法。
技术介绍
[0002]人群分析是公共安全领域的一项基本任务,包括人群计数、人群定位、人群异常事件检测、人群流/人群运动分析、人群分割、群体检测等。而异常事件检测是人群场景安全预警的一项基本任务。对正在发生的异常事件及时报警对于确保公共安全至关重要。
[0003]目前的异常检测方法主要分为局部分析和全局分析两大类。局部分析方法是检测发生异常事件的异常对象,如卡车或人群中的行人,并定位异常发生的位置。如Liao等人在文献“H.Liao,J.Xiang,W.Sun,Q.Feng,and J.Dai,
‘
An abnormal event recognition in crowd scene,
’
in Sixth International Conference on Image and Graphics,ICIG 2011,Hefei,Anhui ...
【技术保护点】
【技术特征摘要】
1.一种基于视听学习的人群异常事件检测方法,其特征在于步骤如下:步骤1:输入人群事件视频中的音频信号,对音频信号进行重采样和短时傅里叶变换;步骤2:将步骤1处理后的音频信号的对数梅尔谱图输入VGGish网络进行特征提取,得到音频表征;步骤3:输入人群事件视频序列,对视频序列进行空间变换和时间变换;步骤4:将步骤3处理后的视频序列输入到3D
‑
ResNet网络中进行特征提取,得到视频表征;步骤5:将音频表征和视频表征进行融合处理,得到融合后的特征;步骤6:将融合后的特征输入到分类网络,得到事件类别预测结果。2.如权利要求1所述的一种基于视听学习的人群异常事件检测方法,其特征在于:步骤1中所述的重采样是对音频信号进行16kHz重采样;所述的短时傅里叶变换是对重采样的音频信号进行带有Hann窗口的短时傅里叶变换。3.如权利要求1所述的一种基于视听学习的人群异常事件检测方法,其特征在于:步骤2中所述的特征提取采用改进的VGGish网络,去掉VGGish网络的主成分分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。