当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于多路视频流的人体行为识别方法和系统技术方案

技术编号:43782875 阅读:31 留言:0更新日期:2024-12-24 16:18
本发明专利技术涉及一种基于多路视频流的人体行为识别方法和系统,方法包括以下步骤:获取网络摄像机拍摄的视频流得到图像帧;利用yolov7‑pose算法检测图像帧中的人体,并进行姿态估计,获得人体检测框以及对应关节点坐标;利用SORT算法通过关节点坐标实现人体追踪,为每一个人体检测框分配标识;根据标识区分人体检测框,再利用时空卷积图网络实现人体行为识别,得到行为识别结果;得到行为识别的结果,进行实时可视化显示并且对危险行为发出警报。与现有技术相比,本发明专利技术具有准确性高、可扩展性强等优点。

【技术实现步骤摘要】

本专利技术涉及图像处理和视频理解领域,尤其是涉及一种基于多路视频流的人体行为识别方法和系统


技术介绍

1、行为识别是人工智能为人类生产生活服务的重要基础技术。基于计算机视觉的人员行为识别技术在安防、医疗、交通等领域都得到了广泛的应用。近年来,基于深度学习的算法成为行为识别领域的主流,这类数据驱动的算法精度更高、适应场景更广。人的行为一般有一定的持续时间,准确识别行为就需要输入多帧连续图像或视频,对其时空特征进行同步提取与分析。出于鲁棒性考虑,现有行为识别系统往往首先通过人员检测和人体姿态估计获得人体骨架信息,作为核心行为识别模块的输入。骨架信息是人体动作信息的抽象表示包括关节坐标、关节索引号和关节之间的连接关系。相比于rgb图像信息,骨架信息更少地受光照、遮挡和复杂背景的影响;骨架信息是自然的拓扑图数据,是对于人体运动的直观的建模,更适合作为行为识别的输入。这样,一个大的行为识别系统就被分解为几个子模块,模块化分解流程显然使得系统的开发、调试与维护更简便,但模块过多也可能导致系统效率下降,需要开发人员在效率和鲁棒性间寻找平衡。

2、基于深度学本文档来自技高网...

【技术保护点】

1.一种基于多路视频流的人体行为识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述时空卷积图模型包括关节点流和速度流,所述关节点流为关节点在单帧中的位置信息,所述速度流为同一关节点在相邻两帧图像之间的差值,根据关节点流和速度流得到人体姿态和运动轨迹,进而得到人体行为识别结果。

3.根据权利要求2所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述关节点流和速度流的计算表达式分别为:

4.根据权利要求1所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述关节点包括鼻子、左肩...

【技术特征摘要】

1.一种基于多路视频流的人体行为识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述时空卷积图模型包括关节点流和速度流,所述关节点流为关节点在单帧中的位置信息,所述速度流为同一关节点在相邻两帧图像之间的差值,根据关节点流和速度流得到人体姿态和运动轨迹,进而得到人体行为识别结果。

3.根据权利要求2所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述关节点流和速度流的计算表达式分别为:

4.根据权利要求1所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述关节点包括鼻子、左肩、右肩、左腕、右腕、左肘、右肘、左膝、右膝、右胯、左胯、右脚踝、左脚踝和左肩与右肩的中点。

5.根据权利要求1所述的一种基于多路视频流的人体行为识别方法,其特征在于,所述时空卷积图模型依次包括输入层、时空图卷积层、批次标准化层、时空图池化层、全局池化层和输出层,所述时空卷积图模型的输入为关节点坐标,输出为行为类别的概率值。

6.一种基于多路视频流的人体行为识别系统,其特征在于,包括客户端和服务端,所述系统运行时,执行如权利要求1-5任一所述的...

【专利技术属性】
技术研发人员:刘成菊陈启军王正璞
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1