音视频融合的人员入侵检测方法技术

技术编号：8453573 阅读：190 留言：0更新日期：2013-03-21 19:23

本发明专利技术提供了一种音视频融合的人员入侵检测方法，所述方法为：基于HOG通过检测区域收缩法进行快速人员识别，基于MFCC使用高斯混合模型(GMM)分类器进行实时脚步识别，基于贝叶斯网络的音视频融合决策。本发明专利技术充分利用视频信息（人体识别结果H、前景像素比例R）和音频信息（脚步声识别结果F），基于贝叶斯网络进行融合判决，得到最终的人员入侵检测结果（I）。相对于单一传感器检测，它大大地提高了鲁棒性，时空联合检测区域收缩的方法使它容易满足实时性要求，可以实现更好的实时性和检测精度的平衡。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种信息检测领域的方法，具体地，涉及一种。
技术介绍
人员入侵检测是广泛应用于智能视频监控。它不仅需要高精度，而且需要很高的实时性能。大多数方法不能同时满足这两个要求。一些简单的运动检测方法可以很容易满足实时性，但虚警率高，如帧差法、背景差分法，它们对光照非常敏感。虽然光流法受光照影响很小，但是巨大的计算量很难满足实时性要求。这类基于运动检测的方法于人员入侵检测，并不能排除动物入侵和光照变化带来的虚警。最近，Dalal和Triggs提出了一个人员检测方法，论文名称《Histograms oforiented gradients for human detectionKIEEE Conference on Computer Vision andPattern Recognition (CVPR)，2005年)，具有很好的检测结果。他们的方法使用方向梯度的直方图的(Histograms of Oriented Gradients,HOG)。这种方法被证实完全可以使用线性支持向量机进行行人分类识别。但这种方法的局限是只能处理320x240的图像。用一种稀疏的扫描方法，大概每幅图像要分割成800个检测窗口。此外，如果人的一部分被挡住，在那个区域的HOG特征经过线性支持向量机判决后归为负样本类。近年来音视频(Audio and Video, AV)融合算法在视频监控领域的应用已受到关注。音视频协同矩阵能成功地检测和区分异常的音视频事件。然而，在一个不可预知的环境中，很难区分异常的音视频事件是由小动物或光照变化还是由人员入侵引起的。在论文((Sem1-...

【技术保护点】
一种音视频融合的人员入侵检测方法，其特征在于，所述方法包括如下步骤：步骤一，基于HOG通过检测区域收缩法进行快速人体识别；步骤二，根据步骤一识别出的人体目标，基于MFCC使用高斯混合模型分类器进行实时脚步识别；步骤三，基于贝叶斯网络的音视频融合决策。

【技术特征摘要】

【专利技术属性】
技术研发人员：张重阳，王德富，郑世宝，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人