基于多特征融合的群体行为识别方法技术

技术编号：14945095 阅读：76 留言：0更新日期：2017-04-01 11:33

本发明专利技术公开了基于多特征融合的群体行为识别方法，包括：对三个不同层次的特征信息进行提取，分别是：对单个人提特征，主要考虑的是每帧中每个人的位置、大小、运动信息，以及用卷积神经网络对每个人提取的特征；针对人与人之间的交互进行语义特征提取，主要考虑人与人之间的外在动作关系以及相对朝向关系；对群体行为中人所处的环境提取场景信息。采用全链接条件随机场模型，将这些特征信息进行融合，实现对群体行为的识别。该方法同时考虑了多种特征信息，能更全面、更有效地对群体行为进行描述，提高了群体行为的识别率，在视频监控中有重要的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理技术及模式识别领域，特别涉及基于多特征融合的群体行为识别方法。
技术介绍
行为识别是计算机视觉领域中备受关注的前沿方向，在单个人以及双人之间的行为识别研究方法中，已经取得了显著的成就。而近年来，由于视频监控、人机交互、基于视频的内容检索的需求越来越大，群体行为识别渐渐成为了计算视觉和模式识别的研究热点之一。但是群体行为所涉及的人数多且不固定、人与人之间交互关系的多变性、以及场景的复杂性，对群体行为的研究具有极大的挑战。近年来，许多的群体行为识别研究中工作致力于研究语义信息对群体行为识别的影响，并取得了一定的成果。对于分析视频监控下的群体行为，更需要考虑的是语义信息，即人与人之间的交互以及每个人在特定群体中所扮演的角色。Choi提出一种语义描述符Spatio-TemporalLocal(STL)，主要是利用人与人之间的姿态的相对关系来描述他们之间的交互行为。这种捕捉语义关系的描述符的提出是一图形分类领域的ShapeContext算法为基础的，该特征捕捉了其他人相对于焦点人物的空间位置关系以及人脸方向关系。以场景中的某个人为中心，计算周围人的位置和人脸方向关系，最后用直方图来表示。STL特征可以有效的捕捉人与人之间的空间位置关系和一定的交互关系，但是它的缺点在于没有描述人与人之间的动作关系，所以识别效果不是很理想。Lan提出一种基于外观的动作语义描述符(ActionContext)，利用每个人与周围邻近人的外在动作关系来更好的描述当前人的行为。这种描述符对于动作差异比较大的群体行为识别效果比较好，但是对于视角的变化比较敏感，导致识别率不...
基于多特征融合的群体行为识别方法

【技术保护点】
基于多特征融合的群体行为识别方法，其特征是，该方法包括如下步骤：步骤1、特征提取：分三部分进行不同的特征提取，分别针对单个人提取单人特征信息，对人与人之间的交互提取交互特征，并对群体行为中的人所处的环境进行场景信息提取；步骤2、特征融合：将人与人之间的交互特征与场景信息融合，采用含有径向基函数的支持向量机分类算法得到行为得分，作为全链接条件随机场模型的一元势，而针对单个人所提取的特征信息作为全链接条件随机场模型的二元势，将所提取的所有特征融合于一个模型中，进行群体行为识别。

【技术特征摘要】
1.基于多特征融合的群体行为识别方法，其特征是，该方法包括如下步骤：步骤1、特征提取：分三部分进行不同的特征提取，分别针对单个人提取单人特征信息，对人与人之间的交互提取交互特征，并对群体行为中的人所处的环境进行场景信息提取；步骤2、特征融合：将人与人之间的交互特征与场景信息融合，采用含有径向基函数的支持向量机分类算法得到行为得分，作为全链接条件随机场模型的一元势，而针对单个人所提取的特征信息作为全链接条件随机场模型的二元势，将所提取的所有特征融合于一个模型中，进行群体行为识别。2.根据权利要求1所述的群体行为识别方法，其特征是，所述步骤1具体包括：步骤1-1、针对单个人所提的特征信息，考虑每个人的位置信息、大小信息、运动信息，这三种信息都属于最基本的外在表征信息；并采用卷积神经网络对单个人提特征，这种特征提取的方法是针对整幅图片提取特征，经过多个卷积层、降采样层操作，最终得到的特征是高层次的语义组合，这种方法比单纯的外在特征能更好地描述单个人的行为、姿态信息；步骤1-2、针对人与人之间的交互进行特征提取，分别以每个人为中心，将他周围的与他邻近的人视为他的上下文，根据自身行为以及周围邻近人所表现的行为，提取行为上下...

【专利技术属性】
技术研发人员：陈昌红，余晓，干宗良，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人