The invention relates to a method for identifying pedestrian anomalies based on probabilistic latent semantic analysis, which mainly solves the problems of weak capability of feature representation and insufficient classification in the prior art. The method includes the following steps: human motion target extraction from video files to the target area, extracting spatio-temporal interest point and the HOG3D/HOF descriptors are characterized by K, means clustering of all descriptors feature vector classification, generating video dictionary, and set up his bag model, then training probabilistic latent semantic analysis model to test video classification. The invention can accurately identify the movement of human body, and has certain robustness to the movement of the environment scene and the change of the human body shape.
【技术实现步骤摘要】
:本专利技术涉及一种利用计算机视觉进行人体行为识别的方法,具体地说是一种对待分析视频中的人体行为进行分类的方法,属于模式识别
技术背景:人体行为识别是近几年来计算机视觉领域的重大热点之一,其在运动捕获视频监控等多领域获得了初步的应用,并具重大的应用前景。由于人体运动的多变性和多样性,背景的嘈杂以及背景运动等多方面的因素严重影响人体运动的识别效果,实现人体行为识别是计算机视觉领域长期存在的问题。在人体行为识别问题中,研究者常对图像强度值在局部范围内有显著变化的像素点感兴趣,这些“兴趣点”通常被称为时空兴趣点(Space-TimeInterestPoints,STIP)。Harris角点就是一种常用的兴趣点,2003年,Laptev等人最先将空间域的Harris角点检测推广到时空域,得到3D-Harris角点。该方法较好的克服了尺度、速度、视角等变化,但检测到的时空角点过于稀疏。2005年,Dollar等人提出了Cuboids检测算法,在空间2D高斯滤波器的基础上引入时间Gabor滤波器,将相应函数高于某一阈值的区域定义为时空兴趣点,使提取的兴趣点更为稠密。然而Dollar方法不具有尺度不变性,2008年,Willems等人提出了基于三维Hessian矩阵的兴趣点检测方法,在保证兴趣点稠密性的同时具有尺度不变性。在以上时空兴趣点的检测方法中,一旦背景中有其他微小运动目标,时空兴趣点同样会记录这些微小运动。检测出兴趣点后,需要选择合适的局部特征描述子对兴趣点进行特征表示。Laptev等人采用基于HOG和HOF的特征描述子对3D-Harris角点表示 ...
【技术保护点】
一种基于概率潜在语义分析的行人异常识别方法,其特征在于,包括下述步骤:步骤A、取一个视频样本,采用混合高斯背景建模算法提取前景目标,对该视频每一帧生成仅含人体目标的二值掩码图片,通过掩码图片生成仅含人体目标的视频;步骤B、采用基于三维Hessian矩阵检测生成视频的时空兴趣点;步骤C、采用HOG3D/HOF描述子计算步骤B中检测到的时空兴趣点,获得相应的特征向量;步骤D、采用K‑mean聚类算法对视频的特征向量集合建立视频图像的词袋模型;步骤E、采用概率潜在语义分析模型训练视频集,进行行人异常识别。
【技术特征摘要】
1.一种基于概率潜在语义分析的行人异常识别方法,其特征在于,包括下述步骤:步骤A、取一个视频样本,采用混合高斯背景建模算法提取前景目标,对该视频每一帧生成仅含人体目标的二值掩码图片,通过掩码图片生成仅含人体目标的视频;步骤B、采用基于三维Hessian矩阵检测生成视频的时空兴趣点;步骤C、采用HOG3D/HOF描述子计算步骤B中检测到的时空兴趣点,获得相应的特征向量;步骤D、采用K-mean聚类算法对视频的特征向量集合建立视频图像的词袋模型;步骤E、采用概率潜在语义分析模型训练视频集,进行行人异常识别。2.根据权利要求1所述的一种基于概率潜在语义分析的行人异常识别方法,其特征在于,所述的步骤A包括:步骤A1、读取视频前n帧,用混合高斯模型建立背景模型,对每一帧不断更新背景模型;步骤A2、每读取新的一帧,根据步骤A1所得背景分割出仅含人体的二值图像;步骤A3、将二值图像与原图像做掩膜操作,生成仅含人体目标的灰度图像;步骤A4、将这一系列的灰度图像合并成仅含前景人体的视频。3.根据权利要求1所述的一种基于概率潜在语义分析的行人异常识别方法,其特征在于,所述的步骤B包括:步骤B1、三维Hessian矩阵定义为其中,σ、τ分别为空间和时间尺度,ξ、η分别表示x、y或t,g(·;σ2,τ2)为高斯平滑函数,在该尺度下,对每一个像素计算Hessian矩阵行列式,得到兴趣点响应函数S=|det(H)|,在时间、空间和尺度(x,y,t,σ,τ)上采用非最大值抑制选择局部最大值作为兴趣点的位置;步骤B2、极值点尺度归一化,时空兴趣点局部极值所在尺度和真实尺度之间的关系为:也就是说在5维空间(x,y,t,σ,τ)中,将极值点处的尺度乘以得到兴趣点尺度,计算过程采用积分视频和盒滤波器进行加速。4.根据权利要求1所述的一种基于概率潜在语义分析的行人异常识别方法,其特征在于,所述的步骤C包括:步骤C1、将兴趣点周围的视频块划分为不同...
【专利技术属性】
技术研发人员:余国刚,顾丽军,彭伟鸿,惠志洲,戴小荣,巢文科,
申请(专利权)人:江苏新通达电子科技股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。